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Wstęp 


Każda osoba mająca wyższe wykształcenie o charakterze ścisłym powinna posiadać 
podstawową wiedzę probabilistyczną. Zrozumienie podstawowych intuicji oraz ele- 
mentarnych pojęć takich jak histogram, zmienna losowa, wartość oczekiwana, prze- 
dział ufności i kilku innych jest niezbędne do prawidłowego funkcjonowania w swoim 
zawodzie. Dotyczy to także, a może nawet przede wszystkim informatyków. Są oni 
obecnie swoistymi pionierami postępu i dlatego właśnie ich kształcenie powinno za- 
wierać solidną porcję probabilistyki. Sama informatyk zresztą zrewolucjonizowała 
w ostatnim dwudziestoleciu statystykę. Z jednej strony, opracowano zupełnie nowe 
metody statystyczne wykorzystujące olbrzymią moc obliczeniową komputera. Z dru- 
giej strony, wiele standardowych procedur statystycznych wymagających żmudnych 
obliczeń i korzystania z tablic zostało zaimplementowanych w łatwo dostępne progra- 
my komputerowe, co stanowi nieocenioną pomoc wszystkim prowadzącym badania 
eksperymentalne, analizy porównawcze, itp. 

Zdecydowana większość procesów fizycznych, technicznych, społecznych, ekono- 
micznych i innych, przebiega w sposób bardziej lub mniej losowy. Zjawiskami, któ- 
rych przebieg jesteśmy skłonni uważać za dość przypadkowy są na przykład: 


e rzut kostką do gry — nie wiemy, ile oczek wypadnie, 
e opady deszczu w Krakowie w roku 2008 — nie wiemy, kiedy i ile będzie padać, 


e gra na giełdzie — nie wiemy, ile będzie warta jednostka „naszego” funduszu 
powierniczego za dwa tygodnie, a tym bardziej za rok. 


Z drugiej strony, obserwujemy zjawiska, które jesteśmy skłonni uważać za zde- 
terminowane. Są nimi na przykład: 


e ruch wskazówek zegarka — potrafimy określić ich położenie po upływie, po- 
wiedzmy, 47 minut, 


e nabór dzieci do klas pierwszych w szkole podstawowej w ciągu najbliższych 
sześciu lat — liczba pierwszoklasistów w roku 2008 powinna być równa, znanej 
już, liczbie dzieci urodzonych w roku 2001, 


e oszczędzanie na stały procent — 100 zł przy oprocentowaniu rocznym 10% da 
po dwóch latach 121 zł. 


Zwróćmy jednak przy tym uwagę na kilka oczywistych faktów: 


e obserwowana losowość zjawisk może wynikać raczej z naszej niewiedzy, czy 
też z niedoskonałości środków technicznych, którymi dysponujemy, niż z sa- 
mej natury zjawisk — ruch kostki, na przykład, podlega przecież określonym 
prawom fizycznym i gdybyśmy znali kierunek i wartość siły, z jaką rzucono 
idealnie symetryczną kostkę, to moglibyśmy (teoretycznie) wypisać równania 
ruchu i rozwiązując je, określić liczbę oczek, która ukaże się na górnej ściance, 


e nie istnieją (w zasadzie) procesy w pełni zdeterminowane — wiemy, że 100 zł 
złożone na 2 lata na 10% da nam 121 zł, jednak w przypadku bankructwa 
banku możemy nie dostać ani grosza. 


Rachunek prawdopodobieństwa i statystyka są tymi działami matematyki, które 
badają i opisują zjawiska, uwzględniając ich losowy charakter. Potrafimy na przy- 
kład uzasadnić, że rzucając 100 razy kostką, prawie na pewno uzyskamy w sumie 
więcej niż 330, lecz mniej niż 370 oczek, przy czym zwrot „prawie na pewno” można 
będzie odpowiednio sprecyzować. Możemy też określić oczekiwaną wielkość naboru 
do klasy pierwszej w kolejnych nadchodzących latach. Liczba ta nie jest, jak sugero- 
wano wyżej, równa liczbie dzieci urodzonych siedem lat wcześniej — trzeba bowiem 
uwzględnić pewne dodatkowe czynniki: migracje, umieralność lub przewlekłe choro- 
by, a których wielkość może być określona na podstawie wieloletnich obserwacji przy 
użyciu metod statystycznych. Metody statystyczne mogą też pozwolić na określenie 
przewidywanej wielkości opadów w roku 2008 w Krakowie oraz ich intensywność 
w poszczególnych miesiącach. 


Podręczniki 


Zachęcam studentów do korzystania z bogatego wyboru podręczników, a zwłaszcza 
zbiorów zadań. W poniższej liście sugerujemy jedynie niektóre z ciekawszych pozycji: 


1. Lesław Gajek, Marek Kałuszka, Wnioskowanie statystyczne dla studentów, 
Wydawnictwo Naukowo- Techniczne, Warszawa, 1998. 


Objętościowo niewielki, ale zawierający dużo ciekawego materiału podręcznik, 
obejmujący niezbędne podstawy z rachunku prawdopodobieństwa. Korzysta- 
jąc z niego można sobie szybko „przyswoić” znaczną ilość materiału. 


2. Jacek Jakubowski, Rafał Sztencel, Rachunek prawdopodobieństwa dla prawie 
każdego, Script, Warszawa, 2006. 
Wyczerpujący kurs rachunku prawdopodobieństwa, zawierający mnóstwo cie- 


kawych przykładów. 


3. Janina Jóźwiak, Jarosław Podgórski, Statystyka od podstaw, Polskie Wydaw- 
nictwo Ekonomiczne, Warszawa, 2006. 


Przeznaczony głównie dla ekonomistów podręcznik, obejmujący statystykę opi- 
sową i kurs rachunku prawdopodobieństwa. 


4. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków tech- 
nicznych i przyrodniczych, Wydawnictwo Naukowo- Techniczne, Warszawa, 2001. 


Integruje od samego początku statystykę opisową, klasyczny rachunek praw- 
dopodobieństwa i wnioskowanie statystyczne. 


5. Włodzimierz Krysicki i współautorzy, Rachunek prawdopodobieństwa i staty- 
styka matematyczna w zadaniach, cz. I, II, Wydawnictwo Naukowe PWN, War- 
szawa, 2004. 


Obszerny zbiór standardowych zadań z rachunku prawdopodobieństwa i staty- 
styki, poprzedzanych krótkim wstępem teoretycznym oraz serią rozwiązanych 
zadań. 


6. Jerzy Ombach, Rachunek prawdopodobieństwa wspomagany komputerowo — 
Maple, Wydawnictwo UJ, Kraków, 2000. 


Nie zawiera statystyki. 


Wspomaganie komputerowe 


Ponieważ z kursu korzystają przede wszystkim informatycy, zdecydowalismy się za- 
tem omawiać, bardziej szczegółowo niż w podobnych kursach ogólnego typu, za- 
gadnienia związane z możliwością stosowania metod komputerowych w statystyce. 
W szczególności, w rozdziale 8 wspominamy o generowaniu liczb pseudolosowych, 
metodzie bootstrap oraz o jądrowej estymacji gęstości. Także w innych rozdziałach 
zakładamy, że student będzie miał dostęp do specjalistycznego oprogramowania sta- 
tystycznego lub matematycznego. Autor tego skryptu posługiwał się programem 
Maple, który jest programem wspomagającym szeroko rozumiano działalność ma- 
tematyczną, a w szczególności zawiera wiele procedur statystycznych. Oczywiście, 
można korzystać z innych programów zawierających pakiety statystyczne, w tym 
z programu Excel. Dla wygody Czytelnika na stronach internetowych PWSZ w No- 
wym Sączu 
www.pwsz-ns.edu.pl/=jombach/ 

znajduje się skompresowany plik rps.zip zawierający dokumenty wykonane w śro- 
dowisku Maple z gotowymi do wykonania procedurami wspomagającymi wykład 
i ćwiczenia. Te same pliki znajdują się na załączonej z tyłu skryptu płycie. W trak- 
cie opracowywania tego kursu używaliśmy głównie różnych wersji programu Maple, 
z najnowszą — Maple 10 — włącznie. Zachęcam do korzystania z odpowiednich doku- 
mentów Maple w trakcie czytania tego podręcznika. Wskazówką, że warto to zrobić 
właśnie w tym miejscu, które czytamy będzie: 


MAPLE 


Skrypt ten powstał głównie na podstawie moich wykładów Rachunku Prawdo- 
podobieństwa i Statystyki dla II roku Informatyki Stosowanej w PWSZ w Nowym 
Sączu. Można także go uważać za modyfikację wspomnianego powyżej podręcznika: 
Jerzy Ombach, Rachunek prawdopodobieństwa wspomagany komputerowo — Maple, 
Wydawnictwo UJ, Kraków, 2000, a każe kursu internetowego: Jerzy Ombach, Mar- 
cin Mazur Rachunek prawdopodobieństwa i statystyka, UJ, Kraków 2006. Inicjatorem 
napisania obecnego skryptu był student PWSZ, kierunek informatyka stosowana, 
Pan Grzegorz Jasiński, który sporządził notatki z większej części wykładów, za- 
proponował kilka ciekawych ćwiczeń i zadań, wykonał korektę całego tekstu, a co 
najważniejsze istotnie pomógł w przygotowaniu plików Maple, za co składam mu 
gorące podziękowania. 
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Rozdział 1 


Statystyka opisowa 


1.1 Dane statystyczne 


Podstawowymi pojęciami statystyki opisowej są populacja oraz cecha. Populacją 
będziemy nazywać zbiór skończony, natomiast cechą — funkcję określoną na tym 
zbiorze i przyjmującą wartości w innym, ustalonym zbiorze. Oczywiście, w prakty- 
ce interesują nas tylko niektóre populacje i niektóre cechy. Na przykład, może nas 
interesować populacja studentów informatyki na Uniwersytecie Jagiellońskim, a ce- 
chą może być wiek studenta. Inną interesującą populację mogą stanowić wszystkie 
samochody zarejestrowane w Polsce — cechą może być wówczas numer rejestracyjny 
samochodu lub rok produkcji silnika. 

Celem statystyki opisowej jest podawanie pewnych informacji o wybranych ce- 
chach populacji, które mogą mieć formę liczbową, graficzną lub mieszaną. Przykła- 
dowo, dla populacji studentów informatyki UJ w przypadku gdy cechą jest wiek, 
interesować nas może średni wiek studenta lub jakaś inna charakterystyka (wiek 
najstarszego studenta, wiek najmłodszego studenta i tym podobne), zaś gdy cechą 
jest rok na którym student studiuje, możemy być zainteresowani tak zwaną warto- 
ścią modalną cechy, czyli „numerem” roku na którym studiuje najwięcej studentów 
(przypuszczalnie jest to rok I). Istnieje pewna liczba znanych i ustalonych metod pre- 
zentacji takich informacji. Znajomość tych metod pozwala na używanie specjalnych 
narzędzi do ich realizacji (na przykład statystycznych programów komputerowych), 
a także na porównywanie otrzymanych wyników dla takich samych cech w różnych 
populacjach. Omówimy za chwilę niektóre metody prezentacji informacji o cechach 
populacji. 

Choć w literaturze statystycznej rozróżnia się wiele rodzajów cech, w naszym 
kursie zastosujemy prosty i intuicyjny podział na cechy w skali nominalnej oraz ce- 
chy w skali porządkowej. Pierwsze z nich to cechy mogące przyjmować niewiele (ściśle 
określonych) wartości, natomiast te drugie to cechy, które przyjmują wartości licz- 
bowe, co umożliwia ich porównywanie. Zwróćmy jednak uwagę na to, iż rejestracja 
samochodu nie należy do żadnej z tych dwóch skal, a takie cechy jak: liczba rodzeń- 
stwa, ocena uzyskana z egzaminu lub miejsce w finale olimpijskim biegu na 100 m, 


można zaliczyć do obu z nich. Tym niemniej, ponieważ zdecydowana większość cech 
może być zaliczona do jednej (i tylko jednej) z wymienionych grup, okazuje się, że 
nawet tak nieprecyzyjna definicja wystarcza dla naszych celów. Przykładami cech 
w skali nominalnej są: kolor oczu, przynależność państwowa, płeć lub stan cywilny, 
zaś w skali porządkowej — wiek, waga lub temperatura. 

Jak już wspomnieliśmy wcześniej, w literaturze statystycznej można także spo- 
tkać inne klasyfikacje cech, niejednokrotnie uwzględniające więcej skal niż skala no- 
minalna i porządkowa. Są one ważne ze względu na to, iż niektóre metody statystycz- 
ne można stosować jedynie do opisu cechy w ściśle określonej skali. Świadomość więc 
tego, w jakiej skali znajduje się interesująca nas cecha, pozwala wybrać odpowiednią 
metodę badawczą. 


1.1.1 Skala nominalna 


Przypuśćmy, że rozważamy populację, w której skład wchodzi dokładnie n-elemen- 
tów (populacja n-elementowa). Oznaczmy przez X badaną cechę, zaś przez 
w1, W2, ..., wę — wszystkie możliwe wartości cechy X. Natomiast przez x; będziemy 
oznaczać wartość cechy X dla i-tego elementu populacji. Tak więc znajomość ciągu 


TL1, T2, ..., Tn 


jest pełnym i z pozoru najprostszym sposobem prezentacji cechy X. Ciąg ten na- 
zywa się często danymi surowymi. Jednak dość rzadko się zdarza, że znamy dane 
surowe, czyli wartości cechy dla poszczególnych elementów (zauważmy, że może to 
być bardzo długi ciąg). Jeżeli, na przykład, interesuje nas stan cywilny mieszkańców 
milionowego miasta, to nasz ciąg posiada dokładnie 1 000 000 elementów, co spra- 
wia, że trudno jest go analizować lub prezentować. Zamiast tego możemy być zatem 
zainteresowani wartościami 
N1, N2,- . -3 Nk; 


gdzie n; jest liczbą elementów populacji mających wartość w;, zwanymi licznościami 
cechy. Zauważmy, iż w przypadku stanu cywilnego mieszkańców miasta wystarczy 
podać tylko dwie liczby — liczbę osób stanu wolnego (nı) oraz liczbę osób zamęż- 
nych/żonatych (na), na przykład: nı = 215678 oraz na = 184322. Oprócz wartości 
n; interesują nas tak zwane częstości fi, które definiujemy jako: 


h 
f=% 


n 


1.1 PRZYKŁAD 
Oceny sprawdzianu w pewnej grupie studenckiej to: 


5,2,5,4, 5,4, 4,3,5,5, 4,5. 
Zinterpretować wprowadzone powyżej pojęcia. 
MAPLE 


10 


Populacją jest tutaj 12 osobowa grupa. Cecha X to ocena studenta. Zbiór war- 
tości cechy to zbiór {2,3,4,5}. Dane surowe to ciąg: 5, 2,5,4,5, 


4,4,3,5,5,4,5. Liczności cechy to: 1,1,4,6, a częstości to: 5) 5: 1 


1 I 
372: 
Warto zauważyć, że zachodzą równości: 

ni+no+ngz+ ... Hnk=n 


Oraz 
fit+ fz+ fs+ aw +fk=l. 


Stosowana jest też procentowa reprezentacja częstości — jest to ciąg: 
Q1,02,03,... Qk; 


gdzie 
Qi = fi J 100%. 


1.1.2 Skala porządkowa 


Mówimy, że cecha X posiada skalę ciągłą, jeżeli wartości tej cechy można w spo- 
sób naturalny traktować jako liczby rzeczywiste. Tak jak poprzednio, wartości tej 
cechy dla kolejnych elementów populacji oznaczamy jako £1,...,£n, gdzie n jest 
wielkością populacji, zaś gdy dysponujemy tymi wszystkimi wielkościami, mówimy 
o danych surowych. W przypadku skali porządkowej istnieje więcej możliwości opisu 
danej cechy niż w przypadku skali nominalnej. Podobnie jak przedtem, dane suro- 
we zawierają pełną informację o cesze X, jednak posługiwanie się nimi, zwłaszcza 
w przypadku dużej populacji, jest niewygodne. Przykładowo, znając wyniki matu- 
ry z języka polskiego na poziomie podstawowym 2320 kandydatów na studentów 
psychologii, powiedzmy: 


71,51,59, 50,49, 45, 40,60, . . . , 79, 49, 40, 
LL MiĖ———Řħťi 
2320 


oraz 3549 kandydatów na studentów pedagogiki, powiedzmy: 


62, 61, 48, 37,39, 65, 32,60, . . . „63,82, 44, 
siimaa 
3549 


możemy mieć trudność w odpowiedzi na proste pytania, takie jak: którzy kandydaci 
są lepiej przygotowani, gdzie jest większa rozpiętość ocen i tym podobne. Dlate- 
go też, jak poprzednio, zamiast danych surowych warto rozważać inne możliwości 
prezentacji cechy, które pozwalają na porównywanie ich w różnych populacjach. 
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1.1.3 Kumulacja danych 


Przypuśćmy, że chcemy przeanalizować wiek ludności miasta, powiedzmy Nowego 
Sącza, liczącego ok. 90 tysięcy mieszkańców. Załóżmy, iż udało nam się zdobyć listę 
z wiekiem mieszkańców. Cechę, jaką jest wiek, można traktować jako cechę w skali 
porządkowej. Na początku chcielibyśmy mieć jakąś wstępną informację o naszych 
danych, na przykład ich interpretację graficzną. Najczęściej stosowaną wtedy me- 
todą jest kumulacja danych, która polega na podzieleniu zbioru wartości cechy na 
określone przedziały (klasy) oraz obliczeniu liczności każdego z nich, to jest licz- 
by elementów populacji, dla których wartość cechy mieści się w danym przedziale. 
Skumulowane dane można wówczas zaprezentować w postaci tak zwanego szeregu 
rozdzielczego lub histogramu. 
Spróbujmy teraz sprecyzować nasze powyższe rozważania. Ustalmy dowolne 


ao < min(£1, £2,... ,Zn) Oraz ak > MAX UA GE 


Niech i-tą klasą będzie (prawostronnie domknięty) przedział (a;_1, a;|. Wówczas licz- 
ność i-tej klasy wyraża się wzorem: 


Ni = HT; : Tj E (ai—1, ail}, 


gdzie #A oznacza liczność zbioru A, Możemy także, analogicznie jak dla skali no- 
minalnej, zdefiniować częstość i-tej klasy w następujący sposób: 

z HT; : Tj E€ (a;_1, az] | 
fi = , 


n 


lub, alternatywnie, jej procentowy odpowiednik: 
w; = fi- 100%. 


Klasy wyznaczone przez punkty a; muszą być rozłączne. dlatego są one pra- 
wostronnie domknięte. Oczywiście można używać klas [a;_1,a;), lewostronnie do- 
mkniętych i zawsze warto się upewnić, jaka konwencja jest stosowana w używanym 
podręczniku lub programie komputerowym. 

Powróćmy teraz do rozważanego wcześniej przykładu. 


1.2 PRZYKŁAD 
Załóżmy, że poniższa tabela zawiera dane dotyczące wieku mieszkańców Nowego 
Sącza (pamiętajmy jednak, iż są to dane fikcyjne): 


Wiek Liczba mieszkańców 
0-10 1852 

10 — 20 10632 

20 — 40 30821 

40 — 60 27602 

60 — 80 8971 

80 —... 2123 
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Zauważmy, że ostatnia klasa nie ma określonego prawego końca. Można, oczy- 
wiście, w miejsce kropek napisać np. 200, lecz byłoby to sprzeczne ze zdrowym 
rozsądkiem. 


Konstrukcja szeregu rozdzielczego na podstawie danych surowych wymaga pod- 
jęcia decyzji o liczbie i długości klas. Zwykle przyjmuje się, że należy wprowadzić 
5-20 przedziałów, w zależności od ilości oraz rozmieszczenia danych. Chociaż w po- 
wyższym przykładzie klasy nie były równej długości, jednak na ogół wygodniej jest 
dzielić dane na przedziały o równych długościach, co zdecydowanie ułatwia później- 
sze obliczenia. Wówczas długość każdego z nich wyraża się wzorem: 


po Sk - ao > max zi - zak 
gdzie k jest liczbą klas, zaś n — liczbą elementów populacji. 

Graficzną reprezentację szeregu rozdzielczego możemy uzyskać tworząc tak zwa- 
ny histogram. Oględnie mówiąc, jest to funkcja stała na przedziałach odpowiada- 
jących poszczególnym klasom, której wartościami mogą być zarówno liczności ni, 
częstości fi lub częstości procentowe wy, jak i inne wielkości, uzyskane przy zastoso- 
waniu odpowiedniej miary liczności, np. a W tym ostatnim przypadku otrzymuje- 
my następującą definicję: 


— fuj: xj € (ai-1,ai]} 

hn 
Zauważmy, że dzięki podzieleniu przez h, pole ograniczone wykresem funkcji hist 
i osią 0X jest równe 1, co w niektórych przypadkach okaże się bardzo wygodne dla 
naszych rozważań. 


hist(x) dla x € (ai—1, ail. 


1.2 Miary tendencji centralnej 


W przypadku cechy o skali nominalnej, rozważa się zasadniczo jeden parametr cha- 
rakteryzujący tendencję centralną. 
Niech zatem X będzie cechą w skali nominalnej. 


1.3 DEFINICJA 
Moda (wartość modalna) jest to najczęściej występująca wartość zmien- 
nej X. W przypadku, gdy kilka wartości jest osiąganych taką samą liczbę 
razy, wówczas każda z nich jest modą. 


1.4 PRZYKŁAD 

Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w okre- 
ślonym czasie na pewnym parkingu, zaś cechą — nazwa producenta samochodu. Jej 
wartości mogą wyglądać, na przykład, tak: 


Fiat, BMW, Ford, Ford, Fiat, Skoda, Fiat, Polonez, Toyota, Toyota, 
Toyota, Renault, Opel, Fiat, Opel, Opel, Toyota. 
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Nasza cecha ma dwie mody: Fiati Toyota. 


W przypadku cechy o skali porządkowej, mówiąc o tendencji centralnej, mamy na 
myśli jej „środek” , czyli położenie centralnych wartości tej cechy. Można to rozumieć 
zarówno jako przeciętną wartość, czyli średnią (ale którą?), lub jako wartość, która 
dzieli posortowany ciąg wartości na równe części. Zajmiemy się najpierw sytuacją, 
gdy dysponujemy danymi surowymi. 

Rozumując pierwszym sposobem zdefiniujmy podstawowy, zapewne doskonale 
znany parametr, zwany średnią arytmetyczną. 

Niech X będzie cechą w skali porządkowej. 


1.5 DEFINICJA 
Jeżeli cecha X przyjmuje wartości £1, %£2,..., £n, WÓWCZAS jej średnią 
arytmetyczną, lub krótko średnią, nazywamy: 


— ttrt ... dp 14 
= m Lis 
z B ; 


n 


Definiuje się też inne wartości średnie, np. średnią harmoniczną lub średnią geo- 
metryczną, lecz nie mają one takiego znaczenia jak zdefiniowana powyżej średnia 


arytmetyczna. 
Inną miarą tendencji centralnej jest tak zwana mediana. Dla danego ciągu liczb 
11,...,Tn, określamy ciąg 1(q),... ,t(n), który powstaje przez jego niemalejące upo- 


rządkowanie, czyli: 


1.6 DEFINICJA 
Medianą cechy X, przyjmującej wartości t1,..., £n, Nazywamy środkowy 
wyraz ciągu 1(1);: - - ;T(n), gdy n jest liczbą nieparzystą, lub średnią aryt- 
metyczną dwóch wyrazów środkowych, gdy n jest liczbą parzystą. Zatem: 


_ | Tæ) dla n=2k+1 
MET) Botten gą n=2k. 


Tendencję centralną cechy w skali porządkowej charakteryzuje również moda, 
o której mówiliśmy w przypadku cechy nominalnej — w tym przypadku ma ona 
jednak niewielkie znaczenie. 

Zobaczmy teraz na przykładzie, w jaki sposób oblicza się zdefiniowane powyżej 
parametry, a następnie jak można z nich „odczytać” pewne globalne informacje na 
temat interesującej nas cechy. 


1.7 PRZYKŁAD 
Wskazać miary tendencji centralnej wynagrodzeń pracowniczych, na podstawie po- 
niższej listy płac pewnego zakładu liczącego dziesięciu pracowników: 
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850 zł 
870 zł 
950 zł 
1000 zł 
1050 zł 
1080 zł 
1090 zł 
2700 zł 
2900 zł 
10 7200 zł. 


O © FIOO 2 W NM HH 


MAPLE 


Srednia: z = 


850+870+950+1000+1050+1080+1090+2700+2900+7200 __ 
; = 1969 (zł). 


Mediana: me = 1501080 — 1065 (zł). 


Moda: każdą z powyższych wartości można uznać za modę, ponieważ występuje 
tylko jeden raz. 


Jak widać, w naszym przykładzie wartość średnia różni się znacznie od mediany. 
Wyobraźmy sobie sytuację, że osoby o niskich pensjach w przedstawionej firmie będą 
dążyć do uzyskania podwyżki. Poinformują na pewno, że średni zarobek w firmie to 
tylko 1065 złotych. Osoby lepiej zarabiające będą opierały się na innych obliczeniach 
i stwierdzą, że zarobki są wysokie i wynoszą średnio 1969 złotych. I kto mówi prawdę? 
Jedni i drudzy. 

Oczywiście nie zawsze będzie tak jak w tym przypadku, to znaczy, że parametry 
będą tak znacznie różnić się od siebie. Warto jednak wspomnieć, że różnica między 
tymi parametrami bywa często wykorzystywana w różnych sytuacjach i jest źródłem 
wielu mylących informacji. 

Niekiedy, na przykład przy ocenie stylu skoków narciarskich, mierzy się tendencję 
centralną, stosując metodę kompromisową, polegającą na odrzuceniu pewnej liczby 
wyrazów skrajnych i obliczeniu średniej arytmetycznej z wyrazów pozostałych. 


1.3 Miara rozrzutu 


Skoro już udało nam się określić, za pomocą zdefiniowanych w poprzednim punk- 
cie (punkt 1.2) parametrów, położenie „środkowych” wartości cechy X o skali po- 
rządkowej, zajmijmy się teraz problemem tak zwanego rozrzutu wartości tej cechy. 
Określenie parametrów rozrzutu jest niezwykle istotne, zwłaszcza w przypadku, gdy 
chcemy uzyskać informację, w jakiej odległości od centralnych znajdują się pozostałe 
wartości cechy X. 


1.8 DEFINICJA 
Jeśli cecha X przyjmuje wartości z1, £2,...,&n, WÓWCZAS jej średni błąd 
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definiujemy następująco: 


1 n 


gdzie © jest wartością średnią. 


Wartość bezwzględna występująca w powyższej definicji gwarantuje, że wynik 
obliczeń będzie dodatni (z wyjątkiem przypadku, gdy cecha X przyjmuje dokładnie 
jedną wartość — wówczas otrzymamy 0). 

Zdefiniowane powyżej pojęcie interpretujemy następująco: im średni błąd jest 
bliższy 0, tym cecha X ma mniejszy rozrzut. 


1.9 DEFINICJA 
Jeśli cecha X przyjmuje wartości x1, %£2,..., £n, WÓWCZAS jej wariancją 
nazywamy liczbę: 


Podobnie jak poprzednio, zarówno wariancja, jak i odchylenie standardowe, są za- 
wsze liczbami nieujemnymi (dodatnimi, gdy cecha X przyjmuje przynajmniej 2 różne 
wartości), interpretowanymi następująco: mała (duża) wartość wariancji/odchylenia 
standardowego oznacza mały (duży) rozrzut wokół średniej. 


1.10 PRZYKŁAD 
Obliczyć miary rozrzutu dla cechy z przykładu 1.7. 


MAPLE 
Średni błąd: b = [850—1969|--|870 a -..-+[7200—1969| _ 1387.60 (zł). 
Wariancja: s2 = (850—1969)? +(870 o H... +(7200—1969)? _ 3560929 (zł). 


Odchylenie standardowe: sn = y's2 1887.04 (zł). 


Dla porównania, wykonajmy podobne obliczenia nie uwzględniając dziesiątej, 
najlepiej zarabiającej, osoby. 


sredni błąd: b = [850—1388|-+|870 RE -..-+|2900—1388| A, go” 65 (zł). 
Wariancja: s2 — (850—1969)*+-(870 OE -..-+(7200—1969)? 578395.06 (zł). 


Odchylenie standardowe: sn = y s œ~ 760.52 (zł). 
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Widać wyraźnie, że średni błąd zmalał o około 50%, wariancja — o około 85%, 
zaś odchylenie standardowe — o około 60%. 

Patrząc na powyższe rozważania wydaje się, iż najlepszy parametr do analizy 
rozrzutu to odchylenie standardowe, ponieważ jest ono, bardziej niż średni błąd, 
czułe na zmiany oraz osiąga znaczenie mniejsze wartości niż wariancja, co jest nieco 
wygodniejsze do interpretacji. 


'Tendencja centralna oraz rozrzut mogą być także opisane za pomocą tak zwanych 
kwantyli. Przypominamy, że przez z(q),...,t(n) oznaczyliśmy niemalejąco uporząd- 
kowany ciąg 11,...,Tq. Ustalmy liczbę p € (0,1). 


1.11 DEFINICJA 
Niech X będzie cechą przyjmującą wartości 11,...,Xq oraz niech k będzie 
taką liczbą naturalną, że s! <p< E, Liczbę £x) nazywamy kwantylem 
rzędu p cechy X i oznaczamy przez qp. 


Należy w tym miejscu podkreślić, iż w literaturze, a także w oprogramowaniu 
statystycznym, używa się również nieco innych definicji kwantyli. Przykładowo, do 
wyznaczenia qp bierze się liczbę np, zaokrągla się ją do najbliższej liczby całkowitej 
(połówki zaokrąglamy w górę), ustala się liczbę k równą maksimum z tak otrzymanej 
liczby i liczby 1, aby w końcu za qp przyjąć się liczbę zg). Te dwie (i nie tylko te) 
definicje dają w dużej liczbie przypadków, choć oczywiście nie zawsze, ten sam wynik. 

Mówiąc ogólnie, ale niezbyt nieprecyzyjnie, kwantyl rzędu p to liczba, która dzieli 
(niemalejąco uporządkowany) ciąg wartości danej cechy na dwie części w proporcjach 
100% -p i 100%. (1 — p). Tak więc, zdefiniowana poprzednio mediana jest, po prostu, 
kwantylem rzędu f (choć w przypadku, gdy n jest liczbą parzystą, wartości te mogą 
się niewiele różnić). Wśród kwantyli wyróżniamy także kwartyle, czyli kwantyle q4 
(pierwszy kwartyl, Q1), qi (drugi kwartyl, Q2, czyli mediana) i q3 (trzeci kwartyl, 


Q3). 


1.12 PRZYKŁAD 
Załóżmy, że interesująca nas cecha X przyjmuje następujące wartości: 


7, 24,30, 15, 7, 23, 28, 23, 2, 18. 
Wyznaczyć kilka wybranych kwantyli cechy X. 
Najpierw porządkujemy (niemalejąco) nasze dane: 
2,7,7, 15, 18, 23, 23, 24, 28, 30, 
a następnie wyznaczamy przykładowe kwantyle: 


18 + 23 


q0.04 = 2, q0.12 = 7, qi = 18 (ale me = = 20.5), 
q0.99 = 30, Q2 = q1 = 18, Q3 = 24. 


17 


1.4  Dystrybuanta empiryczna 


Podamy teraz określenie dystrybuanty empirycznej cechy X w skali porządkowej, 
zwanej czasem skumulowaną funkcją gęstości. 


1.13 DEFINICJA 
Niech cecha X przyjmuje wartości 11,%9,..., £n. Funkcję określoną wzo- 
rem: 


s S << 
F(x) = SE E dla x € R, 
n 
nazywamy dystrybuantą empiryczną cechy X. 


Zauważmy, że wykorzystując pojęcie dystrybuanty empirycznej, można zapisać 
prosty wzór określający kwantyl rzędu p: 


qp = minfz : F(x) > p}. (1.1) 


Tak sformułowany warunek jest, oczywiście, równoważny definicji 1.11. 


1.5 Parametry cechy w przypadku szeregu rozdzielcze- 
go. 


Zajmiemy się teraz sytuacją, w której nie dysponujemy pełną informacją na temat 
wartości cechy dla poszczególnych elementów populacji, a jedynie danymi zapisanymi 
w postaci szeregu rozdzielczego. Także i w tym przypadku można mówić o tendencji 
centralnej, rozrzucie oraz dystrybuancie empirycznej. 

Rozważmy zatem cechę X w skali porządkowej, dla której mamy dany szereg 
rozdzielczy, którego klasy wyznaczają punkty ao <q < ... < ag. Niech n1,..., Nk 
będą licznościami tych klas oraz niech: 


_ Qi—1 F Gy 


Y= 5 dla ż=1,...,k. 


1.14 DEFINICJA 
Wartość średnią dla szeregu rozdzielczego cechy X określamy wzorem: 


Jak widać, określona w powyższej definicji wielkość jest sumą składników odpo- 
wiadających poszczególnym klasom, przy czym wielkość każdego składnika zależy 
od położenia danej klasy oraz jej liczności. Zauważmy, że w skrajnym przypadku, 
to znaczy gdy każdy przedział zawiera dokładnie jedną wartość cechy, będącą jego 
środkiem, definicja powyższa pokrywa się z definicją średniej z danych surowych. 
Oczywiście, w ogólnym przypadku średnia obliczona z danych surowych będzie się 
różnić (na ogół niewiele) od średniej wyznaczonej dla szeregu rozdzielczego. 


18 


Analogicznie, na podstawie szeregu rozdzielczego można wyznaczyć średni błąd, 
wariancję oraz odchylenie standardowe cechy. 


1.15 DEFINICJA 
Średnim błędem dla szeregu rozdzielczego cechy X nazywamy liczbę: 


1€ - 
—) niy: — z|, 
n 

1=1 


o 
II 


wariancją — liczbę: 
k 
1 B 
Sh mm 5 nilyi E z), 
ei 
zaś odchyleniem standardowym — liczbę: 


Sn = ŚR: 


Z kolei, do określenia dystrybuanty empirycznej z szeregu rozdzielczego wygodnie 
jest wykorzystać, zdefiniowaną poprzednio, funkcję hist. 


1.16 DEFINICJA 
Funkcję określoną wzorem: 


F(x) = Ja hist(s) ds = J hist(s) ds, 


nazywamy dystrybuantą empiryczną (lub skumulowaną funkcją gęstości) 
dla szeregu rozdzielczego cechy X. 


Geometryczna interpretacja powyższej definicji jest oczywista: wartość F(c) to 
pole figury, ograniczonej wykresem funkcji hist, osią 0X oraz prostą x = c. 
Dystrybuanta empiryczna z szeregu rozdzielczego posiada następujące własności: 


1. x <y => F(x) <F(y) (F jest funkcją niemalejącą), 
2. lim F(x) = F(a) (F jest funkcją ciągłą), 


3. lim F(z)=F(ag) =0. 


1——00 


4. lim F(x)= F(ap)=1. 


T00 
Wprowadzimy teraz pojęcie kwantyli dla danych skumulowanych. Ustalmy liczbę 
p € (0, 1). 
1.17 DEFINICJA 
Kwantyl rzędu p dla szeregu rozdzielczego cechy X o dystrybuancie F 


definiujemy jako: 
qp = min{z : F(x) > p}. 
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Zauważmy, że powyższy wzór wygląda dokładnie tak samo, jak wzór (1.1). Jednak 
w przypadku danych skumulowanych, sytuacja się bardzo często upraszcza — jest 
tak wtedy, gdy każda klasa szeregu rozdzielczego zawiera co najmniej jedną wartość 
cechy. Wówczas F jest funkcją silnie rosnącą na przedziale [ag, ak], a więc jest na tym 
przedziale odwracalna, co powoduje, że kwantyl rzędu p można określić następująco: 


qp=F""(p), 


gdzie F71 oznacza funkcję odwrotną do F na przedziale [ag, ax]. 


1.6 Cwiczenia i zadania 


Ćwiczenie 1.1 Dane o skali nominalnej można prezentować graficznie. Często uży- 
wanym sposobem jest tak zwany wykres kołowy (ciasteczko). 


MAPLE 
Dla następujących danych (patrz przykład 1.1): 


5, 2, 5, 4, 5, 4, 4, 3, 5, 5, 4, 5, 


wykres kołowy wygląda tak: 
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lub tak: 


Ćwiczenie 1.2 W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanoto- 
wano następujące zmiany cen akcji (w procentach): 


- 4.6, - 4.5, - 4-6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, - 2.1, - 0.7, - 
1.2, -5, 0.6, -3, -4, 0, 0.5, 2.3, - 1.5, - 4.1, - 1.1, 1.5, - 2.2, 0, 1.4, 0.3, 2.3, - 6.1, - 
5.6, 2.7, 3.4, -2, - 0.3, 4.2, - 6.1, 0.9, - 2.3, 5.1, - 0.2, 0.6, -4, -2, 0.9, - 0.7, - 2.4, 
2, - 2.9, 5.6, 0, - 0.9, 0, 0, 0 , - 2.2, - 0.8, - 1.1, - 2.2, 0, 0.9, 0.2, 1.3, 2.7, - 0.6, - 
2.7, - 1.5, - 3.6 , 0, - 0.6, - 2.6, 0, - 4.3, 0, -4, 2.9, - 1.9, - 0.5, 0, 2.8, - 2.3, - 0.3, 
- 1.4, 1.9, 0, - 4.3, 0.4, 0, - 1.9, 2.2, 1.2, - 0.9, - 1.6, 0.8, 0, 0, - 1.3, 0.8, 0, - 3.9, 
-6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5, 1.9, - 0.6, 2, 0.8, - 4.7, - 0.2, 
1.3, 2.3, - 3.8, - 0.3, 0, 0, 1, 1.5, 1.6, 0.5, - 3.3, - 0.7, 0, - 4.9, 0.5, 0, 3.9, - 3.8, - 
1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5 , - 2.4, - 4.6, 1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 
1.9, -1, - 1.7, - 0.2, - 3.4, - 0.6, - 0.7, 1.4, 1.2, 0, 5.2, 0.9, 0.8, - 0.6, 1.9, 1.5, 5.1, 
1.9, 4.2, 0.9, 1.3, 0.9, - 2.3, 1.5, - 0.5, 2.2, 0, 1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2, - 0.1, 
-1, 3.8, - 1.2, - 1.5, 2.4, 0, 0, -1, 0, - 1.2, 0.7, 0, 0.4, 0.4, - 0.3, - 1.4, 0.4, 0.4, - 
6.4, - 6.3, 2, 0.8, 0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4 , - 1.1, - 3.8, -1, - 1.6, 2.1, 
-3, 4.6, 0.9, 0, 0.3, - 1.3, - 5.8, - 0.6, 0.4, 0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 
7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2. 


MAPLE 
Interpretacja graficzna danych surowych w postaci wykresu słupkowego wygląda 
następująco: 
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Wydaje się, że nie jest ona zbyt pomocna, więc spróbujemy inaczej spojrzeć na te 
dane. Najpierw je posortujemy: 


- 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, - 4.7, - 4.6, - 4.6, - 
4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, - 3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, 
- 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7 , - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 
2.3, - 2.3, - 2.2, - 2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, 
- 1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3 , - 1.3, - 1.3, 
- 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1,- 1.1, - 1.1, - 1.1, -1, -1, -1, -1, -1, -1, -1, - 0.9, - 
0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 
0.6, - 0.6, - 0.6, - 0.6, - 0.6 , - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 
0.3, - 0.2, - 0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, O, 0, 0, 0, 0, 0, 0, 0, 0, O, O, O, 0, O, 
0, 0, 0, 0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.3, 0.4, 0.4, 0.4, 0.4, 
0.4, 0.4, 0.5, 0.5, 0.5, 0.6, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.8, 0.8, 0.9, 0.9, 0.9, 0.9, 
0.9, 0.9, 0.9, 1, 1, 1, 1, 1, 1.1, 1.2, 1.2, 1.3, 1.3, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.5, 1.6, 
1.9, 1.9, 1.9, 1.9, 1.9, 2, 2, 2, 2, 2, 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.7, 2.7, 2.7, 2.8, 2.9, 3, 
3, 3 , 3.4, 3.8, 3.9, 4, 4, 4.2, 4.2, 4.6, 5, 5.1, 5.1, 5.2, 5.6, 7, 8, 9. 


Teraz wykres słupkowy ujawnia więcej informacji. 


Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały 
większe wzrosty niż jakikolwiek zanotowany spadek. 
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Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na 
klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu stats): 


> transform[tallyinto] ([x]l, [seq(-8 +i..-7 + i, i = 1..17)]); 
gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami: 


Weight(-7 .. -6, 5), 
Weight(-6 .. -5, 4), 


Weight(-5 .. -4, 10), 
Weight(-4 .. -3, 15), 
Weight(-3 .. -2, 18), 
Weight(-2 .. -1, 33), 


Weight(1 .. 2, 23), 
Weight(2 .. 3, 16), 
Weight(3 .. 4, 6), 
Weight(4 .. 5, 5), 
Weight(5 .. 6, 5), 
Weight(6 .. 7, 0), 

7.. 8, 

8.. 9, 

9.. 10. 


Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił. 


1.18 UWAGA 
Maple stosuje klasy lewostronnie domknięte. 


Możemy teraz narysować histogram wykazujący liczności klas: 


-5 5 10 


Wiele programów statystycznych rysuje histogram na podstawie danych suro- 
wych. Oto taki histogram — odpowiada on funkcji hist. 
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Ćwiczenie 1.3 Oprócz średniej arytmetycznej rozważa się także inne średnie. Na 
przykład, dla cechy o wartościach dodatnich 11,...,tq, warto czasem używać tak 
zwanej średniej geometrycznej: 


Sg = bjj"... Lre 


Rozpatrzmy (prawie rzeczywisty) przykład. Na pewien elitarny kierunek stu- 
diów, oferujący tylko 25 miejsc, o przyjęciu decydują punkty z dwóch przedmiotów 
maturalnych, powiedzmy z przedmiotu A oraz z przedmiotu B. Z danego przedmiotu 
można uzyskać od 0 do 100 punktów, ale w praktyce zgłaszają się kandydaci mają- 
cy co najmniej 70 punktów z każdego przedmiotu. W celu ustalenia odpowiedniego 
rankingu trzeba brać pod uwagę oczywiście oba przedmioty, a więc najprostszym 
rozwiązaniem wydaje się być wzięcie średniej arytmetycznej. Jednak wtedy wszyst- 
kie wyniki będą zawierać się w przedziale od 70 do 100, zatem (biorąc pod uwagę 
także połówki punktów) będzie możliwych 61 wyników. Przy 200 kandydatach, wiele 
osób będzie miało taką samą liczbę punktów, co może powodować kłopoty z decyzją 
o przyjęciu. 


MAPLE 


Natomiast biorąc pod uwagę średnią geometryczną, a właściwie jej kwadrat, 
wydłużamy sobie skalę — od 4 900 do 10 000 tysięcy — a więc te same wyniki nie 
powinny się zbyt często powtarzać. 


Owiczenie 1.4 Rozważa się też często tak zwaną średnią ważoną. Niech będą dane 
wartości cechy 11,...,Tq oraz dodatnie liczby w1,..., Wp, ZWANE wagami. Wówczas 
średnia ważona to wielkość: 


1 
Sy = (WIE +... + Wnln), 


gdzie w = w1 +... + Wy. 
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Wagi są najczęściej określane indywidualnie i subiektywnie. Przydzielając dużą 
wagę konkretnej wartości powodujemy, że wielkość ta ma większy wpływ na średnią 
obliczaną w powyższy sposób. Na przykład, na zakończenie studiów ustala się oce- 
nę końcową na podstawie następujących parametrów: średniej ocen ze wszystkich 
przedmiotów, oceny pracy dyplomowej oraz wyniku egzaminu dyplomowego. Zdarza 
się, że uczelnie na niektórych kierunkach przyjmują wagi: 4 dla średniej ocen, 2 dla 
oceny pracy dyplomowej oraz 2 dla wyniku egzaminu dyplomowego. Inne uczelnie, 
preferujące jeszcze bardziej średnią ze studiów, mogą z kolei przyjąć, odpowiednio, 
następujące wagi: 6, 1, 1. 


Ćwiczenie 1.5 Wyznaczymy parametry dla danych z GPW, zaprezentowanych w ćwi- 
czeniu 1.2. 


Najpierw policzymy parametry dla danych surowych. 


Średnia: © = —0.365625. 

Co prawda, w tamtym dniu na GPW był WZROST a nie spadek indeksów, 
jednakże nie jest sprzeczne z naszym wyliczeniem, bo indeksy wzrostu są średnimi 
ważonymi, a nie arytmetycznymi. 


Mediana: me = 0. 
Na pierwszy rzut oka jest to dość dziwny wynik, ale po dokładniejszym przyj- 
rzeniu się danym można go łatwo uzasadnić. 


Moda: 0. 


Wariancja: s2 ~ 6.02148. 

Ale można także dostać wynik: s2 = 5.99796! To, że pewne parametry staty- 
styczne daje się zdefiniować na dwa (lub nawet trzy), nieznacznie różniące się mię- 
dzy sobą sposoby, jest dość typową sytuacją. W tym przypadku, ta druga wielkość 
została obliczona z następującego wzoru: 


Co ciekawe, oba wyniki można otrzymać wykorzystując dwa różne pakiety staty- 
styczne programu Maple, o których wspominaliśmy na poprzednich ćwiczeniach (czy 
pamiętasz ich nazwy?). Jak zobaczymy w rozdziale 7, dzielenie przez n — 1 (zamiast 
przez n) jest w pewien sposób uzasadnione. 


MAPLE 


Na zakończenie obliczymy parametry dla danych skumulowanych w szereg roz- 
dzielczy. 


Średnia: z = —0.234375. 
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Mediana: me ~ 0.034722. 
Wariancja: s2 ~ 6.3123. 


Ćwiczenie 1.6 Do graficznej reprezentacji kwantyli, a w zasadzie kwartyli, służy 
wykres określany mianem „pudełko z wąsami”. 

Górna i dolna krawędź owego pudełka to Q3 oraz Q1. Przez środek pudełka prze- 
chodzi linia, która oznacza medianę. „Wąsy” to wypustki biegnące od pudełka w górę 
i w dół, zakończone liniami poziomymi określającymi położenie najbardziej skrajnych 
elementów. 


Istnieje pewne zróżnicowanie pudełek z wąsami, związane ze znaczeniem poszcze- 
gólnych linii. Warto jest zawsze spojrzeć na stronę Pomocy programu z którego się 
korzysta. Oto fragment Pomocy pakietu stats z programu Maple: 

„A box plot comprises these elements: 


1) A box with 


- a central line showing the median, 
- a lower line showing the first quartile, 


- an upper line showing the third quartile; 


2) Two lines extending from the central box of maximal length 3/2 the interquartile 
range but not extending past the range of the data; 


3) Outliers, points that lie outside the extent of the previous elements." 


MAPLE 
A oto pudełko z wąsami dla danych (surowych) z GPW: 
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Ćwiczenie 1.7 W trakcie pisemnego egzaminu ze statystyki osoby rozwiązujące ze- 
stawy A i B otrzymały następujące wyniki (w punktach): 


A := [11, 9, 9.5, 12.5, 10, 4.5, 4.5, 5, 6, 16, 12, 11, 10, 3.5, 7, 1, 1, 8, 6, 0.5, 15.5], 


B := [4, 10, 11.5, 8, 8.5, 12, 11, 8, 8, 10, 13.5, 3.5, 12, 11, 11, 5.5, 6, 9, 1.5, 11, 
8, 8.5 |. 


MAPLE 


Pierwsze porównanie wyników można zrobić używając pudełek: 


A B 


Od razu widać, że raczej lepsze wyniki były w grupie B, jakkolwiek w grupie A 
osiągnięto najlepszy wynik. 


Zadanie 1.1 Używając wybranego programu komputerowego wykonaj wykresy 
statystyczne omówione na ćwiczeniach. 


Zadanie 1.2 Tworząc szereg rozdzielczy z danych surowych dla cechy w skali po- 
rządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę 
nominalną. Wyjaśnij szczegóły. 


Zadanie 1.3 Przypuśćmy, że jest dwóch kandydatów na studia w sytuacji opisanej 
w ćwiczeniu 1.3: jeden ma dobre i porównywalne ze sobą wyniki z przedmiotu 4, 
natomiast drugi jest zdecydowanie lepszy z przedmiotu A lecz, niestety, zdecydowa- 
nie gorszy z przedmiotu B. Załóżmy, że średnie arytmetyczne tych kandydatów są 
takie same. Który z nich dostanie się na studia? 


Zadanie 1.4 Ocena z egzaminu końcowego z pewnego przedmiotu, ustalana jest 
na podstawie średniej ważonej ocen z dwóch sprawdzianów w trakcie semestru oraz 
oceny z testu końcowego w sesji. Jakie wagi powinno się, Twoim zdaniem, przyjąć 
w tym przypadku? 
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Zadanie 1.5 Zastanów się, jak zdefiniować geometryczną średnią ważoną. 


Zadanie 1.6 Ściągnij ze strony GPW: 
http: //www.gpw.com.pl 


bieżące dane dotyczące zmian kursów akcji i porównaj je z danymi załączonymi do 
ćwiczenia 1.2: (a) obliczając i porównując odpowiednie parametry, (b) rysując obok 
siebie dwa pudełka z wąsami. 


Zadanie 1.7 Dane są następujące wartości cechy X: 
3,5,10,6,8,6,8,10, 12. 


Naszkicuj dystrybuantę empiryczną dla cechy X, a następnie, na tym rysunku, za- 
znacz wszystkie kwartyle tej cechy. 


Zadanie 1.8 Podaj przykładowe wartości cechy, dla której mediana jest dwa razy 
większa od średniej. 


Zadanie 1.9 Niech z1,...,£n będą wartościami pewnej cechy w skali porządkowej. 
Określmy liczby: 


gdzie s jest odchyleniem standardowym danej cechy. Wykaż, że średnia z tak otrzy- 
manych wartości wynosi 0, zaś odchylenie standardowe jest równe 1. 
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Rozdział 2 


Przestrzenie probabilistyczne 


2.1 Definicja prawdopodobieństwa 


Definicja prawdopodobieństwa, którą będziemy się posługiwać (i która jest obecnie 
w powszechnym użyciu) jest definicją aksjomatyczną. 

Aby ułatwić Czytelnikowi zrozumienie idei definicji aksjomatycznej, przeprowa- 
dzimy na wstępie pewne nieformalne rozumowania. Zaczniemy od analizy bardzo 
prostej sytuacji. Wyobraźmy sobie, że Marek rzuca wielokrotnie dwiema kostkami 
do gry i podaje przez telefon swojemu koledze Tomkowi uzyskaną sumę oczek, któ- 
ra jest liczbą z zakresu od 2 do 12. Na przykład, przy 10 rzutach Tomek mógłby 
zanotować: 

4, 7,5,2,6,11,7,9,9,6. 


Nie wydaje się, aby powyższy ciąg liczb wykazywał jakieś ciekawe prawidłowości, 
jednak przy większej liczbie prób, powiedzmy przy 100 podwójnych rzutach, Tomek 
zauważa, że pewne wyniki powtarzają się zdecydowanie częściej niż inne. Zaintrygo- 
wany próbuje zbadać rzecz dokładniej — postanawia powtórzyć doświadczenie kole- 
gi. Oczywiście, może w tym celu rzucać wielokrotnie parą kostek i zapisywać sumy 
oczek, ale może też (po odłożeniu słuchawki) przeprowadzić symulację komputerową. 


MAPLE 
Oto przykładowy ciąg, jaki może wtedy otrzymać: 


11, 4, 7, 11, 4, 9, 7, 6, 9, 7, 8,8, 12, 10, 6, 8, 6, 6, 6, 10, 7, 3, 6, 10, 5, 8, 6, 7, 8, 3, 
5, 8, 7, 8, 7,8, 7, 11, 12, 5, 8, 5, 8, 5, 10, 3, 5,8, 9,6, 3,9, 5, 6, 10, 7, 10, 9, 9, 10, 
5, 4, 10, 2, 6, 8, 3, 4, 3, 4,9, 7,9, 7,7, 11, 7, 7,8, 4,5, 6, 6, 3,8, 6, 6 

4, 5, 3, 10, 11, 11, 8, 7. 


Wyraźnie teraz widać, że najczęstszymi wynikami są: „6”, „7? oraz „8”, zaś naj- 
rzadziej pojawiało się „2” i „12”. Tomek powtarza kilkakrotnie swoją symulację 
i chociaż za każdym razem otrzymuje inny ciąg wyników, powyższe spostrzeżenie 
pozostaje zawsze bez zmian. 
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Pomożemy Tomkowi wytłumaczyć powody, dla których tak się dzieje. Policzymy 
mianowicie prawdopodobieństwo, z jakim wypadają liczby „środkowe” — „6, „T 
i „8” oraz prawdopodobieństwo, z jakim wypadają liczby będące liczbami „skrajny- 
mi” — „2? i „12”. Jednak wcześniej zastanowimy się, co właściwie dla nas znaczy 
słowo „prawdopodobieństwo”. 

Sprawa definicji pojęcia prawdopodobieństwa nie jest bynajmniej banalna. Ab- 
sorbowała ona uwagę wielu wybitnych matematyków w okresie ostatnich 300 lat 
i chociaż jeszcze dzisiaj wzbudza pewne kontrowersje w niektórych środowiskach na- 
ukowych, to z matematycznego punktu widzenia sprawa jest już dobrze zbadana. 
Podamy za chwilę pełną formalną definicję, wzorowaną na pomyśle Kołmogorowa 
sprzed 70 lat, jednak najpierw doprecyzujemy pewne intuicje, wykorzystując opisaną 
powyżej zabawę z kostkami. 

W naszym przypadku interesują nas zdarzenia odpowiadające wartości sumy 
oczek na dwóch kostkach. Oznaczmy zbiór interesujących nas zdarzeń literą >. 
Jest wiele zdarzeń należących do > — są nimi na przykład zdarzenia, powiedzmy 
S2, 93,.94,...;'912, w których suma oczek jest dokładnie jedną z liczb od 2 do 12. 
Oprócz tych 11 zdarzeń mogą nas interesować także inne zdarzenia, na przykład 
zdarzenie A, w którym suma oczek jest jedną z liczb 6, 7 lub 8, albo zdarzenie B, w 
którym suma oczek nie jest równa ani 2, ani 12. Te dwa ostatnie zdarzenia mogą być 
wyrażone jako, odpowiednio, alternatywa zdarzeń S6, 57, Sg oraz negacja alternaty- 
wy zdarzeń S2 z S12. Do zbioru > należą też dwa istotne, chociaż niezbyt ciekawe, 
zdarzenia: tak zwane zdarzenie niemożliwe (na przykład, że suma oczek na dwóch 
kostkach wynosi 13) oraz zdarzenie pewne (na przykład, że suma oczek jest liczbą 
całkowitą). 

Chcemy teraz każdemu zdarzeniu przypisać liczbę określającą jego prawdopodo- 
bieństwo. Mamy więc do czynienia z funkcją, oznaczmy ją literą P, która zdarzeniom 
przyporządkowuje liczby. Możemy więc napisać: 


P:5 3 S — P(S) €R. 


Zanim powiemy, jak wyznaczyć funkcję P, zwróćmy uwagę, że powinna mieć 
ona kilka charakterystycznych własności. Na przykład, nasza intuicja podpowiada, 
że prawdopodobieństwo musi być liczbą nieujemną, a więc wartości funkcji P po- 
winny być nieujemne. Zgodnie z intuicją, wartość funkcji odpowiadająca zdarzeniu 
niemożliwemu musi być równa 0. Rozsądnie jest też przyjąć, że zdarzenie pewne 
ma prawdopodobieństwo równe 1 (100%, gdy wolimy używać procentów). Najistot- 
niejszym jednak warunkiem, który musi spełniać nasza funkcja P, jest żądanie, aby 
prawdopodobieństwo alternatywy zdarzeń równało się sumie prawdopodobieństw 
tych zdarzeń, oczywiście pod warunkiem, że zdarzenia te wzajemnie się wykluczają. 
Założenie to, zwane zasadą addytywności, oznacza natychmiast, że: 


P(A) = P(S6) + P(S7) + P(S8). 
Potrafimy także wtedy pokazać, że: 


P(B) =1 — (P(S2) + P(S12)). 
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Aby policzyć konkretne wartości prawdopodobieństw P(S) dla wszystkich zda- 
rzeń S$ € >, musimy wniknąć nieco głębiej w naturę badanego zjawiska. Spróbujmy 
najpierw odpowiedzieć na pytanie o to, czym się różnią od siebie zdarzenia, na przy- 
kład, S2 oraz Sg, i dlaczego pierwsze z nich zachodzi rzadziej niż drugie. Otóż zda- 
rzenie S2 zachodzi dokładnie wtedy, gdy na obu kostkach wypadnie „1”, natomiast 
zdarzeniu 55 odpowiadają następujące cztery wyniki: 


(1,4), (2,3), (3,2), (4,1). 


Wyraźnie więc widać, że zdarzenie S5 ma szansę zajść cztery razy częściej niż zda- 
rzenie S9. 

Rozwijając tę myśl dalej zauważmy, że każde zdarzenie z interesującego nas zbio- 
ru > może być utożsamione ze zbiorem par liczb określających wyniki uzyskane na 
obu kostkach. Niech Q oznacza zbiór tych par, czyli: 


Q={(ij): ij =1,2,...,6}. 


Elementy zbioru Q będą w dalszym ciągu nazywane zdarzeniami elementarnymi. 
Tak więc każde zdarzenie S składa się ze zdarzeń elementarnych, jest więc w isto- 
cie podzbiorem zbioru Q, przy czym zdarzenie niemożliwe utożsamiamy ze zbiorem 
pustym, natomiast zdarzenie pewne z całym zbiorem Q. Zauważmy jednak, że nie 
wszystkie zdarzenia elementarne należą do X. Na przykład para (2,3) jest co prawda 
elementem S5, ale przez Tomka, który zna jedynie sumy oczek, nie jest identyfiko- 
wana. Natomiast zdarzenia elementarne (1, 1) oraz (6,6) odpowiadają zdarzeniom 
So oraz S12 należącym do >. 

Można łatwo wyznaczyć prawdopodobieństwo każdego zdarzenia elementarnego 
— ponieważ jest 36 takich zdarzeń i wszystkie one tworzą zdarzenie pewne Q, któ- 
rego prawdopodobieństwo jest równe 1, więc zakładając, że prawdopodobieństwo 
każdego z nich jest takie samo i równa się, powiedzmy, x, z zasady addytywności 
otrzymujemy: 

36x = 1, 


a stąd: 
1 


= 36 
Korzystając dalej z tej zasady, możemy policzyć prawdopodobieństwo każdego zda- 
rzenia 9 € >, a to oznacza poprawne określenie funkcji P. Na przykład: 


T 


5 6 5 6 5 16 
P(S = —, P(S Sea PIA = = ` 
(55) = 36; A = zę P(A)= zę * 36 * 36 7 36 
Sai c | AE 
m 36 36) 36 


Przyjrzyjmy się jeszcze raz, teraz nieco w innej kolejności, naszemu postępo- 
waniu. Mając konkretny problem, określiliśmy najpierw pewien zbiór Q, nazwany 
zbiorem zdarzeń elementarnych. Następnie wyróżniliśmy zbiór interesujących nas 
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zdarzeń > w ten sposób, że każde ze zdarzeń jest zbudowane ze zdarzeń elemen- 
tarnych, więc zdarzenia można traktować jako podzbiory zbioru Q. Określiliśmy 
wreszcie funkcję P: >> — R, która zdarzeniom przyporządkowuje ich prawdopodo- 
bieństwa. Zauważyliśmy przy tym, że zbiór zdarzeń > oraz funkcja P muszą posiadać 
pewne uniwersalne własności. 

Okazuje się, że jest to podejście typowe. Gdy mamy rozpatrywać określoną sy- 
tuację, w której uwzględniamy losowość, powinniśmy w zasadzie postępować według 
powyższego schematu, wyznaczając kolejno Q, X oraz P. Oczywiście, obiekty te 
mogą mieć zupełnie inną postać niż w naszym przykładzie. Ponadto, w pewnych 
sytuacjach zbiór zdarzeń elementarnych może być nieskończony, co już wyklucza 
możliwość zdefiniowania P tak jak poprzednio. Niemniej jednak, w każdej sytuacji 
zbiór zdarzeń > oraz funkcja P powinny mieć podobne własności do tych sugerowa- 
nych w powyższym przykładzie. 

Podamy teraz formalną definicję, precyzującą nasze dotychczasowe rozważania. 


2.1 DEFINICJA — Przestrzeń probabilistyczna 

Niech będą dane: niepusty zbiór Q, pewna rodzina > podzbiorów zbioru 
Q i funkcja P: > — R. Trójkę (Q, 2, P) nazywamy przestrzenią probabi- 
listyczną, gdy zachodzą następujące warunki: 

sA Q€Ż, 

2. jeżeli zbiory A1, A2, A3,... EP, to UZ A, E€ È, 

3. jeżeli A,B EX, to ANŃBE>, 

4. jeżeli A € X, to P(A) 2 0, 

5. jeżeli zbiory A1, Ao, A3,... € © są parami rozłączne, to: 


P(U 4.) = Ż,P(A.), 
1=1 i=l 


6. P(Q)=1. 


Elementy zbioru Q nazywamy zdarzeniami elementarnymi, zaś elementy © — 
zdarzeniami (oczywiście zdarzenie elementarne w € Q może być traktowane jako 
zdarzenie, o ile tylko l-elementowy zbiór {w} należy do >; tak jest w wielu przy- 
padkach, ale nie zawsze!). Zbiór pusty reprezentuje zdarzenie niemożliwe, a zbiór Q 
— zdarzenie pewne. Zdarzenie Q | A nazywamy zdarzeniem przeciwnym do zdarze- 
nia A. Liczbę P(A) nazywamy prawdopodobieństwem zdarzenia A, zaś funkcję P — 
miarą probabilistyczną. 


Podamy teraz (bez dowodu) kilka podstawowych własności przestrzeni probabi- 
listycznych. Większość z nich (poza trzema ostatnimi) jest omawiana w szkole. 


2.2 TWIERDZENIE 
Niech (Q, £, P) będzie przestrzenią probabilistyczną. Wtedy: 
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P(0) =0. 
. jeżeli Ai N Aj = Ø dla i £ j, to: 


. jeżeli A i B są takimi zdarzeniami, że A C B, to: 
P(B) = P(A) + P(B\ 4), 

. dla każdego zdarzenia A: 

P(Q\A)= 1- P(A), 

. jeżeli A i B są takimi zdarzeniami, że A C B, to: 
P(A) < P(B), 

. dla dowolnych zdarzeń A i B: 

P(AU B) = P(A) + P(B) — P(ANB), 
. dla dowolnych zdarzeń A1, Ao, Á3,...: 

P(U 4) < Ð P(A), 


=t =l 


= 


. jeżeli Aj C Ao C A3 C..., to: 


lim P(An)= P( U An), 
n=l 


N—>00 
. jeżeli Ay D Ao D Ag D..., to: 


lim P(A,) = Pf) An). 
n=1 


noo 


W następnych punktach omówimy podstawowe przykłady przestrzeni probabili- 
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2.2 Schemat klasyczny 


Omówimy najpierw najbardziej naturalną przestrzeń probabilistyczną, nazywaną 
schematem klasycznym. 

Niech Q będzie zbiorem skończonym, składającym się z n jednakowo prawdopo- 
dobnych (na razie w sensie potocznym) zdarzeń elementarnych, czyli niech: 


(B= 6 uf] 


oraz niech > składa się ze wszystkich podzbiorów zbioru Q, czyli: 


E = P(Q). 
Jeżeli A € X, to przyjmijmy: 
P(A)= A 
n 


Jest oczywiste, że trójka (Q, 2, P) stanowi przestrzeń probabilistyczną. Z definicją 
tą spotykamy się po raz pierwszy w szkole średniej. 


Schemat klasyczny jest modelem wielu zjawisk. Na przykład, przy rzucie kostką 
symetryczną możemy za Q przyjąć zbiór liczb {1,2, 3,4,5,6} — wtedy prawdopodo- 
bieństwo każdego zdarzenia elementarnego wynosi Ł, gdy rzucamy dwiema kostkami 
symetrycznymi, za zbiór Q bierzemy zbiór wszystkich 36 par utworzonych z liczb 
1,2,3,4,5,6 — wtedy prawdopodobieństwo każdego zdarzenia elementarnego wyno- 

1 


si zę, zaś gdy startując w konkursie wybieramy jedno z 20 pytań, nasz zbiór 


ma 20 elementów i prawdopodobieństwo zdarzenia elementarnego jest równe zg. 
We wszystkich tych przypadkach jest zupełnie naturalnym przyjęcie założenia, że 
wszystkie zdarzenia elementarne są jednakowo prawdopodobne. 

Natomiast gdy kostka została sfałszowana (np. jedna ze ścianek jest nieco cięż- 
sza, tak aby „1” wypadała częściej niż „6” ), schemat klasyczny nie jest odpowiednim 
modelem do opisu rzutu tą kostką. Jednak i wtedy można zbudować odpowiednią 
przestrzeń probabilistyczną — musimy sami odpowiednio określić prawdopodobień- 
stwa zdarzeń elementarnych. Jeżeli na podstawie dłuższej „pracy” ze sfałszowaną 
kostką wiemy, jak często wypadają poszczególne wyniki, możemy zbudować odpo- 
wiednią przestrzeń w następujący sposób: biorąc (2 = 41, 2,3,4,5,6) określamy sześć 
liczb, na przykład: 


pı = 0.26; pa = p3 = p4 = ps = 0.15; pe =0.14, 


a następnie dla każdego zbioru A € > = P(Q) definiujemy: 


P(A)= J pi. 


i:w;EA 


Łatwo teraz sprawdzić, że tak zbudowana trójka (Q, >, P) jest przestrzenią proba- 
bilistyczną, przy czym istotne znaczenie ma to, że suma wszystkich liczb p; równa 
się 1, gdyż suma ta jest prawdopodobieństwem zdarzenia pewnego. 
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W schemacie klasycznym, zbiór interesujących nas zdarzeń > pokrywa się ze 
zbiorem wszystkich podzbiorów zbioru (2. Odpowiada to sytuacji, gdy mamy pełną 
informację o przebiegu zjawiska. Czasem jednak dysponujemy jedynie częściową in- 
formacją — taką sytuację poznaliśmy w poprzednim punkcie (punkt 2.1), gdy Tomek 
znał sumę oczek na obu kostkach, ale nie wiedział, jakie wyniki wypadły na każdej z 
nich. W takich przypadkach klasa zdarzeń © jest istotnie mniejsza niż P(Q). Ogólny 
sposób budowy odpowiedniej przestrzeni probabilistycznej opisujemy poniżej. 

Określamy zbiór zdarzeń elementarnych Q oraz funkcję P jak w schemacie kla- 
sycznym, natomiast klasa zdarzeń > będzie określona w sposób następujący. Przy- 
puśćmy, że: 


0=SU...UŚ%, 


przy czym: 
Si N Sj = Ø dla wszytkich i, j takich, że 1 <i < j <r. 


Określamy > jako zbiór wszystkich możliwych sum, które można utworzyć biorąc 
dowolne zbiory spośród S1,..., Śp. Wyraźnie widać, że powyższa konstrukcja spełnia 
warunki definicji 2.1, a więc (Q, >, P) jest przestrzenią probabilistyczną. Zauważmy 
ponadto, że konkretna przestrzeń tego typu była już omówiona w przykładzie ze 
strony 29 — mieliśmy wówczas rozkład: 


Q0=S>U...US1o2. 


2.3  Prawdopodobieństwo jako miara 


W punkcie 2.1 (patrz definicja 2.1) określiliśmy aksjomatycznie przestrzeń probabi- 
listyczną oraz podaliśmy kilka przykładów takich przestrzeni. Okazuje się, że praw- 
dopodobieństwo jest szczególnym przypadkiem tak zwanej miary, a cały współcze- 
sny rachunek prawdopodobieństwa ma swoje teoretyczne podstawy nierozerwalnie 
związane z teorią miary. Ograniczymy się tutaj do podania jedynie niezbędnych 
informacji dotyczących teorii miary. 

Mieliście zapewne sposobność wielokrotnie obliczać długości odcinków, łuków, 
a może nawet innych krzywych. Obliczaliście też pola różnych figur płaskich oraz 
pola powierzchni i objętości figur przestrzennych, chociaż przypuszczalnie nie zasta- 
nawialiście się zbyt często, co to jest właściwie długość, pole lub objętość. Pojęcia 
te wydają się przecież tak naturalne, że nie było potrzeby, żeby zajmować się ich 
naturą. Zastanówmy się jednak teraz nad tymi sprawami, stawiając najpierw dwa, 
z pozoru naiwne, pytania: 


e czy każdy podzbiór leżący na prostej ma określoną długość? 
a ą 
e czy każda figura zawarta w płaszczyźnie ma pole? 


Pytania te mogą wydawać się z początku dość sztuczne — przecież wszystkie 
figury na płaszczyźnie, które znamy, mają chyba pola (nawet okrąg lub prosta mają 
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przecież pola równe 0). Okazuje się jednak, iż jesteśmy w błędzie — otóż są figury na 
płaszczyźnie, dla których nie można w sposób rozsądny określić pola. Podobnie, są 
też zbiory zawarte w prostej, dla których nie możemy określić długości. Inna sprawa, 
że konstrukcja takich zbiorów nie jest łatwa i nie będziemy jej tu przytaczać. Aby 
jednak pokazać, gdzie mogą być problemy, zastanówmy się, jaką długość posiadają 
zbiory liczb wymiernych oraz liczb niewymiernych należących do przedziału (0, 1). 
Chociaż są to dobrze określone, rozłączne zbiory, mające w sumie długość równą 1, 
nie potrafimy dać rozsądnej odpowiedzi na nasze pytanie, dopóki nie ustalimy, co 
właściwie mamy na myśli, mówiąc długość zbioru. Podobnie powinniśmy wcześniej 
wyjaśnić pojęcia pola figury płaskiej oraz objętości figury przestrzennej. Sprawy te 
są dyskutowane na gruncie tak zwanej teorii miary. 

Zanim jednak podamy odpowiednie definicje podkreślmy, że sprawa dotyczy bar- 
dzo istotnych problemów matematycznych, mających bezpośredni związek z zastoso- 
waniami. W szczególności, współczesny rachunek prawdopodobieństwa i statystyka 
opierają się głównie na teorii miary. 

Poniżej przeprowadzimy dość abstrakcyjne rozważania oraz podamy definicje 
tak zwanej o-algebry|AM2] oraz miary[AM2|, a następnie wrócimy do poprzednio 
zasygnalizowanego problemu. 

Zastanówmy się najpierw, jakie wspólne własności mają długość, pole oraz ob- 
jętość, rozumiane (na razie) jedynie intuicyjnie. Przede wszystkim, możemy trzy te 
wielkości traktować jako funkcje, które odpowiednim podzbiorom przyporządkowują 
liczby rzeczywiste (ewentualnie nieskończoność). Funkcje te są nieujemne oraz ad- 
dytywne, to znaczy że ich wartość dla sumy zbiorów rozłącznych A i B jest sumą ich 
wartości dla A oraz dla B. Wiemy także, że długość odcinka (0, 1) jest równa 1 oraz 
że, podobnie, pole kwadratu o boku 1 oraz objętość sześcianu o krawędzi 1 także 
wynoszą 1. Interesuje nas to, czy funkcje te są określone dla wszystkich podzbiorów, 
odpowiednio, prostej, płaszczyzny i przestrzeni. Tak czy inaczej wiemy, że są one 
określone dla szerokiej klasy zbiorów. Na przykład, pole jest określone dla wszyst- 
kich prostokątów, trójkątów, kół oraz dla zbiorów, które są skończonymi sumami, 
przecięciami lub różnicami tych zbiorów. Zwróćmy jeszcze uwagę na to, że wspo- 
mniane wyżej własności pozwalają, między innymi, na obliczanie pól prostokątów, 
które można zbudować z kwadratu o boku 1, prostokątów o bokach mających dłu- 
gości wymierne, pewnych trójkątów (jako połówek prostokątów) i tak dalej. Intuicje 
te są podstawą dla zrozumienia znaczenia poniższych definicji. 

Niech będzie dany niepusty zbiór Q. Rozważmy rodzinę > podzbiorów zbioru Q, 
czyli > c P(Q). 


2.3 DEFINICJA -— o-algebra 
Mówimy, że rodzina © jest o-algebrą, jeżeli: 


1. QED, 

2. dla dowolnych zbiorów A1, Ao, A3,... € ©: 
U 4; € >, 
i=1 
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3. dla dowolnych zbiorów A,B € X: 
ANBE>. 


Oczywiście widać, że powyższa definicja składa się z trzech pierwszych warun- 
ków nałożonych na przestrzeń probabilistyczną w definicji 2.1. Zauważmy także, 
że rozważamy tutaj sumy nieskończonej liczby zbiorów, składające się jednak tyl- 
ko z przeliczalnie wielu składników. Przypominamy, że zbiór jest przeliczalny, jeżeli 
jego elementy potrafimy ustawić w ciąg nieskończony. Przeliczalnymi zbiorami są, 
na przykład, zbiór liczb naturalnych oraz zbiór liczb całkowitych, gdyż ich elementy 
można ustawić w następujące ciągi: 


OL, Rze POZ EDO ZJ 


Można też udowodnić, że zbiór liczb wymiernych jest przeliczalny, natomiast zbiór 
liczb rzeczywistych jest przykładem zbioru, który nie jest przeliczalny. Bardziej ob- 
razowo można powiedzieć, że zbiory przeliczalne, chociaż nieskończone, mogą być 
przeglądnięte — element po elemencie (stosunkowo łatwo można sobie wyobrazić, że 
zbiór liczb rzeczywistych nie posiada takiej własności). W teorii miary i w rachun- 
ku prawdopodobieństwa założenie, że pewne sumy oraz iloczyny mają przeliczalnie 
wiele składników, jest bardzo istotne. Wprost z definicji 2.3 można również pokazać, 
że zbiór pusty jest elementem o-algebry, czyli: 


ez, 


oraz że o-algebra jest zamknięta również ze względu na iloczyn, to znaczy: 


OO 
A1, Ao, A3,...EX > (4 ED. 
i=1 
Powyższa własność, jak również własność 2 z definicji 2.3, zachodzi także wtedy, gdy 
rozważamy skończone ciągi zbiorów Aq, Ao, A3,..., An. 

Zamiast mówić, że zbiór A należy do o-algebry >, mówi się często, że A jest 
>-mierzalny lub po prostu mierzalny, jeżeli nie ma wątpliwości, o jaką o-algebrę 
w danym momencie chodzi. Używa się też sformułowania przestrzeń mierzalna, na 
określenie pary (Q, X), gdy > jest o-algebrą na Q. 

Trywialnymi przykładami o-algebr są: rodzina P(Q) oraz 2-elementowa rodzi- 
na 0,0). Z drugiej strony zauważmy, że wiele znanych klas zbiorów nie stano- 
wi o-algebr. Jedną z takich klas jest klasa wszystkich zbiorów otwartych w R”. 
Przypominamy, że zbiór G&G C R” nazywamy otwartym, jeżeli dla każdego punktu 
a = (a1,...,dm) E€ G istnieje liczba e > 0 taka, że jeżeli punkt z = (q1,...,1n) 
spełnia warunek: 


|z; — a;| < e dla wszystkich i = 1,...,n, 


to x € G. Uzupełnienia zbiorów otwartych nazywa się zbiorami domkniętymi. Bar- 
dziej obrazowo można powiedzieć, że zbiory otwarte to zbiory nie zawierające swoje- 
go brzegu, natomiast zbiory domknięte to zbiory zawierające wszystkie swoje punkty 
brzegowe. 
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2.4 PRZYKŁAD -— Zbiory borelowskie 

Bardzo ważną o-algebrą jest rodzina B(R”), zdefiniowana jako najmniejsza o- 
algebra zawierająca wszystkie otwarte podzbiory przestrzeni R”. Elementy tej rodzi- 
ny nazywane są zbiorami borelowskimi. Tak więc każdy zbiór otwarty jest zbiorem 
borelowskim, a także zbiory domknięte, jako uzupełnienia zbiorów otwartych, są 
też zbiorami borelowskimi — w szczególności, zbiorami borelowskimi są zbiory 1- 
punktowe. Dalej, zbiór liczb wymiernych Q C R jest borelowski, jako przeliczalna 
suma zbiorów 1-punktowych, a w takim razie liczby niewymierne także stanowią 


zbiór borelowski R \ Q. 


2.5 PRZYKŁAD — Zbiory mierzalne w sensie Lebesgue'a 

Nieco większą o-algebrą niż B(R”) jest o-algebra £(R”), zwana o-algebrą zbiorów 
mineralnych w sensie Lebesgue'a albo w skrócie o-algebrą zbiorów mierzalnych. Nie 
podajemy tutaj formalnej definicji, wspominamy jedynie, że £(R”) powstaje z B(R”) 
przez dołączenie podzbiorów tych zbiorów borelowskich, które w pewnym sensie są 
bardzo chude w przestrzeni R”. Okazuje się, że istnieją podzbiory R” nie będące 
elementami £(R”). 


Niech będą dane niepusty zbiór ©, o-sigma algebra > c P(Q) oraz funkcja: 
wE — RU fool. 
2.6 DEFINICJA — Miara 
Mówimy, że funkcja u jest miarą, jeżeli: 
1. dla każdego zbioru A € ©: 
u(A) > 0, 


2. u(0) =0, 
3. jeżeli zbiory Aq, Ao, A3,... € © są parami rozłączne , to: 


(U A) = VO a(i). 
3-1 i=1 


Porównując powyższą definicję z definicją 2.1 widzimy natychmiast, że funkcja 
P tam określona jest miarą. Zauważmy jednak, że w definicji 2.1 założyliśmy dodat- 
kowo, że P(Q) = 1. 

Okazuje się, że długość, pole i objętość mogą być traktowane jako miary w prze- 
strzeniach R, R? oraz R”. Jednym z ważniejszych twierdzeń w teorii miary jest 
następujące: 


2.7 TWIERDZENIE — Miara Lebesgue'a 
Ustalmy wymiar przestrzeni n. Wówczas istnieje dokładnie jedna miara 
(zwana miarą Lebesgue'a): 


U = Un: L(R”) — RU foo), 


spełniająca następujące warunki: 


38 


1. jeżeli [0,1|” oznacza n-krotny iloczyn kartezjański przedziału [0,1], 
to: 
u([0, 1J”) =l; 


2. dla każdego A € £(R”) oraz p € R”: 


u(ip+z:z€ Aj) = uA), 


co oznacza niezmienniczość miary względem przesunięcia. 


2.8 UWAGA 
Można pokazać, że miary Lebesgue'a nie można rozszerzyć na o-algebrę P(R”). 


Powyższe twierdzenie oraz uwagę można rozumieć w następujący sposób: długość 
podzbioru prostej — u1, pole figury płaskiej — u2, czy też objętość bryły przestrzennej 
— u3, daje się określić dla bardzo wielu, ale nie dla wszystkich, zbiorów. 


2.9 UWAGA 
Ponieważ B(R”) C £(R”), więc miara Lebesgue'a u indukuje miarę na B(R”). 


Powróćmy teraz do pytania o długość zbioru liczb wymiernych z odcinka (0, 1) 
i zauważmy, że (w związku z powyższym) sprowadza się ono do wyznaczenia uı(QN 
(0,1)) — wiemy już, że zbiór ten jest mierzalny. Można udowodnić, co jest dla nas 
oczywiste, że miara Lebesgue'a zbiorów 1-punktowych jest równa 0, więc nasz zbiór 
ma też miarę równą 0 (jako przeliczalna suma zbiorów o mierze 0). W takim razie, 
zbiór liczb niewymiernych z odcinka (0, 1) ma miarę pı równą 1. 

Zauważmy na koniec, że gdybyśmy w definicjach 2.3 i 2.6 ograniczyli się tylko 
do sum skończonych, nie potrafilibyśmy określić miary dla wielu ważnych zbiorów 
(w tym dla tych dyskutowanych przed chwilą), co istotnie zubożyłoby teorię oraz 
możliwość jej stosowania. 


2.4 Losowania 


Podamy teraz dwa ważne przykłady zastosowania schematu klasycznego — losowanie 
bez zwracania i losowanie ze zwracaniem. Przypuśćmy, że mamy dany r elementowy 
zbiór R, z którego losujemy n elementów. Zakładamy, że wszystkie wyniki naszego 
losowania są jednakowo możliwe. Wyobraźmy sobie, na przykład, że w urnie jest 
r =10 ponumerowanych kul i że wyciągamy z tej urny po kolei n = 5 kul. Zauważmy, 
że mogą być tu zastosowane dwie metody losowania: 


e po wyciągnięciu kuli zapisujemy jej numer i wrzucamy ją z powrotem do urny, 


e kolejne wyciągnięte kule ustawiamy obok urny. 
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MAPLE 


W pierwszym przypadku, wynikiem naszego eksperymentu jest ciąg pięciu liczb, 
który, przykładowo, może mieć postać: 


4,2,10,5,7; 3,3,6,1,2; 1,2,3,4,5 lub 7,7,7,7,5; 


każdy taki ciąg jest dla nas zdarzeniem elementarnym. Zauważmy, że kule mogą 
się powtarzać i że musimy uwzględniać kolejność, w jakiej się pojawiają. Gdyby- 
śmy nie uwzględnili kolejności, wynik 1, 2,3,4,5 odpowiadałby wielu losowaniom, 
a wynik 4, 4,4,4,4 tylko jednemu, tak więc prawdopodobieństwo drugiego wyniku 
musiałoby być mniejsze niż prawdopodobieństwo wyniku pierwszego, co w schemacie 
klasycznym nie może zachodzić — a właśnie ten schemat chcemy wykorzystać. 

W drugim przypadku, wynikiem naszego eksperymentu jest zbiór pięciu liczb, 
na przykład: 

{3,5,6,7,8}; {1,2,4,8,10} lub {2,3,4,5,6}; 


każdy taki zbiór jest dla nas zdarzeniem elementarnym. Zauważmy, że kule nie mogą 
się oczywiście powtarzać i że nie uwzględniamy kolejności — wyobraźmy sobie, że 
zamiast wyciągać kule po kolei bierzemy pięć kul jednocześnie (i dopiero wtedy 
odczytujemy numery). 

Wróćmy teraz do sytuacji ogólnej i określmy zbiór Q zdarzeń elementarnych oraz 
obliczmy liczbę jego elementów w przypadku losowania ze zwracaniem i losowania 
bez zwracania. 

W losowaniu ze zwracaniem, Ñ jest zbiorem wszystkich n-elementowych ciągów! 
o wyrazach ze zbioru R, albo inaczej n-krotnym iloczynem kartezjańskim: 


Q= R” = {(r1,..., rn): ri E R dla i=1,... n}. 


Stosując prostą indukcję, można łatwo stwierdzić, że #Q = r”. Na przykład, dla 
n = 2 zbiór Q jest zbiorem wszystkich możliwych par utworzonych z elementów 
zbioru R, a więc ma r? elementów. W takim razie, podczas losowania ze zwracaniem 
prawdopodobieństwo zdarzenia elementarnego wynosi +- 

W losowaniu bez zwracania, Q jest zbiorem wszystkich n-elementowych podzbio- 
rów? zbioru R: 


Q={K:KCR, #K =n}. 
r! 


Można łatwo obliczyć moc zbioru Q. Mianowicie, #Q = (,), gdzie (,) = AMI 
jest znanym ze szkoły symbolem Newtona. W takim razie, podczas losowania bez 
zwracania prawdopodobieństwo zdarzenia elementarnego wynosi TI 


2.5 Prawdopodobieństwo geometryczne 


2.10 DEFINICJA — Prawdopodobieństwo geometryczne 
Niech G C R” będzie zbiorem borelowskim, to jest G € B(R”), oraz niech 


! Dawniej takie ciągi nazywano n-elementowymi wariacjami z powtórzeniami. 
2Mówi się też o n-elementowych kombinacjach. 
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jego miara Lebesgue'a u(G) będzie dodatnia i skończona. Określamy c- 
algebrę 
5=fANG:AEB(R”)| 


i prawdopodobieństwo 


u(ANG) 


P(ANG) = "CJ 


Można sprawdzić, że trójka (G, ©, P) jest przestrzenią probabilistyczną. 


Model opisany przy pomocy prawdopodobieństwa geometrycznego jest niekiedy 
stosowany w sytuacji, gdy zdarzenia mogą być w sposób naturalny interpretowane 
jako liczby rzeczywiste (czas, długość) lub wektory w przestrzeni R”. 


2.11 PRZYKŁAD 

Dwoje internautów umówiło się na spotkanie w sieci między godziną 17 a 18, przy 
czym ze względu na koszty połączenia będą na siebie czekać co najwyżej 10 minut 
i nie dłużej niż do godziny 18. Jakie jest prawdopodobieństwo tego, że się spotkają? 


MAPLE 


Wydaje się*, że w tym przypadku przestrzenią zdarzeń elementarnych Q może 
być kwadrat [0, 1] x [0,1] (jednostką jest 1 godzina), a miarą probabilistyczną miara 
Lebesgue'a (każdy moment między 17 a 18 włączenia się do sieci jest jednakowo 
możliwy). Chcemy obliczyć prawdopodobieństwo zdarzenia 


A= (03) EQ: le- yl < 5). 


Jak łatwo się przekonać, wynosi ono 0.31. 


30 
Maciek 


3Patrz następny przykład. 
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2.6 Kłopoty z wyborem przestrzeni 
— Paradoks Bertranda 


Zdarza się często, że mając konkretną sytuację musimy skonstruować odpowia- 
dającą jej przestrzeń probabilistyczną. W wielu przypadkach procedura jest oczywi- 
sta, ale czasem mogą powstać wątpliwości. Typowym przykładem jest tu następujące 
zadanie: 


2.12 PRZYKŁAD — Ostrzeżenie 

Dany jest okrąg o promieniu r = 1. Jakie jest prawdopodobieństwo tego, że losowo 
wybrana cięciwa tego okręgu jest krótsza niż bok trójkąta równobocznego wpisanego 
w ten okrąg? 

Zadanie to ma kilka różnych rozwiązań, w zależności od metody losowania. 

(1) Mając ustalony jeden z końców cięciwy, wybieramy taki trójkąt równoboczny 
wpisany, że jego wierzchołek jest w tym punkcie. Losowanie cięciwy oznacza ustale- 
nie drugiego jej końca. Tak więc Q jest całym okręgiem, za > naturalnie jest przyjąć 
rodzinę zbiorów mierzalnych na okręgu, a P jest miarą Lebesgue'a (długością) po- 
dzieloną przez 2a. Widać, że prawdopodobieństwo interesującego nas zdarzenia jest 


równe 2. 


MAPLE 


(2) Aby wylosować cięciwę, wystarczy podać jej środek. Tutaj Q jest kołem, 
>, jest rodziną zbiorów borelowskich zawartych w kole, a P jest miarą Lebesgue'a 
podzieloną przez pole koła 7. Łatwo policzyć, że teraz prawdopodobieństwo naszego 
zdarzenia wynosi 4. 

Zauważmy, że można też podać inne rozwiązania tego zadania. Powyższy para- 
doks, zwany paradoksem Bertranda, jest spowodowany tym, że nie sprecyzowaliśmy, 
co to znaczy, że cięciwa jest wybierana w sposób „losowy”. 
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2.7 Cwiczenia i zadania 


Ćwiczenie 2.1 Z pudła, w którym jest pięć par butów, dziecko wyciąga dwa buty. 
Jakie jest prawdopodobieństwo tego, że są one z jednej pary. 


MAPLE 
Zdarzeniem elementarnym jest tutaj każdy 2-elementowy podzbiór zbioru 10- 


elementowego. Tak więc zbiór Q ma elementów. Zdarzenie sprzyjające A skła- 


2 
da się pięciu elementów, bo tyle jest par butów, a więc jego prawdopodobieństwo 
wynosi: 


Ćwiczenie 2.2 Skreślamy siedem spośród czterdziestu dziewięciu liczb. Jakie jest 
prawdopodobieństwo tego, że maszyna losująca (bez zwracania) sześć z 49 kulek z 
numerami od 1 do 49, wylosuje dokładnie cztery „nasze” liczby? 


MAPLE 


Zdarzeniem elementarnym jest tutaj każdy 6-elementowy podzbiór zbioru liczbo- 


wego {1,...,49}. Natomiast zdarzenie A polegające na tym, że wśród sześciu liczb 
wylosowanych przez maszynę są dokładnie cztery „nasze” liczby, składa się z ta- 
kich 6-elementowych podzbiorów zawartych w £1,...,49), że cztery ich elementy są 


wybrane ze zbioru ”-elementowego — jest (30) takich możliwości, a dwa pozostałe ze 
zbioru o 42 (= 49 — 7) elementach — jest (4) takich możliwości. Ponieważ te dwa 
wybory są dokonywane niezależnie od siebie, to moc zbioru A jest iloczynem (1) ($). 
W takim razie: 

_RA_((Ż) _ 205 


DEE = = 0.002154991170. 
+0 (Œ) 95128 


P(A) 


Proponujemy Wam policzenie podobnych wielkości dla różnych parametrów. Za- 
uważycie wtedy, że trafienie, na przykład, dwójki jest dużo bardziej możliwe, bo 
wynosi około 0.1680893112. 


Ćwiczenie 2.3 Jeżeli zbiór Q jest skończony, to oczywiście każda o-algebra składa- 
jąca się z podzbiorów A. jest skończona. Warto się zastanowić, jak wyglądają takie 
o-algebry. 
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Największą z nich jest P(Q), zbiór wszystkich podzbiorów zbioru Q, zaś naj- 
mniejszą — rodzina składająca się z dwóch elementów, to jest 40,0). Jeżeli Q ma 
więcej niż dwa elementy, to można wskazać także inne o-algebry. Niech A,B C Q 
będą dwoma niepustymi, rozłącznymi zbiorami takimi, że AU B = Q. Z naszego 
założenia wynika, że przynajmniej jeden ze zbiorów (A lub B) posiada więcej niż 
jeden element. Niech, na przykład, A zawiera dwa różne elementy wi i w2. Widać, 
że rodzina £0, A, B,Q) jest o-algebrą. Jest ona różna od P(Q), gdyż nie zawiera 
żadnego ze zbiorów {w1} i {w2}. 

We wprowadzającym przykładzie o sumie oczek na kostkach, mieliśmy 11 zbio- 
rów, 99, ..., S12. Tutaj o-algebrą > jest rodzina składająca się ze wszystkich moż- 
liwych sum utworzonych z tych zbiorów. Można utworzyć tyle takich sum, ile jest 
wszystkich podzbiorów zbioru 11 elementowego, czyli 2!!. Chociaż jest to duża licz- 


ba, to nasza o-algebra jest o wiele mniejsza od P(Q), która ma 23% elementów. 


Ćwiczenie 2.4 Jakie jest prawdopodobieństwo tego, że na roku liczącym 100 stu- 
dentów znajdziemy dwie osoby obchodzące urodziny tego samego dnia? 


MAPLE 


Tutaj zdarzeniem elementarnym jest 100-elementowy ciąg o elementach będących 
kolejnymi dniami roku. Przyjmując upraszczające założenia, że rok ma 365 dni i że 
we wszystkich dniach roku rodzi się mniej więcej tyle samo ludzi mamy do czynienia 
z zagadnieniem równoważnym losowaniu ze zwracaniem — 100 razy losujemy datę. 
Mamy więc #9 = 3651 (jest to naprawdę duża liczba). W tym zadaniu wygodniej 
będzie wyznaczyć zdarzenie przeciwne do interesującego nas zdarzenia, oznaczmy je 
przez A, a następnie skorzystać z własności 4 z twierdzenia 2.2. Zdarzenie A składa 
się ze zdarzeń elementarnych odpowiadających ciągom, których wszystkie wyrazy 
są różne. Ponieważ mając wybrany 100-elementowy zbiór, możemy z niego utworzyć 
100! różnych ciągów, a z 365 elementów możemy utworzyć (365) różnych zbiorów, 
więc #A jest równa iloczynowi tych dwóch liczb. W takim razie: 


a — 100! G88) 
P(A) = —z6510 > 


natomiast interesujące nas prawdopodobieństwo wynosi 1 — P(4). Używając pro- 
gramu Maple, wyliczamy: 


P(A)  .3072489279 - 1075 oraz 1— P(A) ~ .9999996928. 


Warto także przyjrzeć się wynikom otrzymanym dla innych liczebności grupy. 
Bardzo pomocny okazuje się tu arkusz kalkulacyjny wbudowany w Maple: 
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k binomial(365., k) kT (k) i binomial(365., k) kT (k) 
365.% 365.% 
5 9128644263 0271355137 
10 „8830518223 .1169481777 
20 .5885616164 .4114383836 
50 .02962642042 9103735796 
100 „3072489279 - 1076 „9999996928 


Ćwiczenie 2.5 Podamy przykład przestrzeni probabilistycznej, która jest różna od 
schematu klasycznego. Chociaż prawdopodobieństwa wszystkich zdarzeń elementar- 
nych są tu, podobnie jak poprzednio, dodatnie, jednak istotną różnicę stanowi to, że 
zbiór zdarzeń jest nieskończony. 


Niech doświadczenie polega na rzucie kostką (symetryczną) — rzucamy nią tak 
długo, aż wypadnie „6%. Niech w; oznacza zdarzenie, że za i-tym razem po raz 
pierwszy wypadła „6”. Policzmy prawdopodobieństwo p; tego zdarzenia. Mamy tu 
następny przykład losowania ze zwracaniem — i losowań ze zbioru 6-elementowego. 
Łatwo wyliczyć, że p; = (2)! . t dla dowolnego i = 1,2,3.... Przyjmijmy zatem 
Q = fwi,wa,w3,...) oraz X = P(Q). Dla dowolnego A € X definiujemy: 


P(A)= X pi. 


i:w;EA 


Korzystając z tego, że > 724 pi = 1, można sprawdzić, że (Q, >, P) stanowi przestrzeń 
probabilistyczną. 


MAPLE 


Aby lepiej sobie wyobrazić opisaną powyżej sytuację, przeprowadźmy dziesięć 
doświadczeń polegających na rzucaniu kostką do momentu wypadnięcia „6”. Oto 
wyniki: 

2, 2,4, 3,3, 1, 5, 3, 1,4, 6; 
2,4, 1,1, 1, 6; 

6; 
3,3,1,1,3,1,2,1,2,5,1,4,4,3, 1, 6; 
5,2, 1, 6; 

1, 2,5, 6; 

3, 1, 5, 2, 5, 4, 6; 

2, 6; 

2, 3, 4, 6; 
2,1,1,1,1,4,1, 1,6. 
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Ćwiczenie 2.6 Spośród 5 kul niebieskich, 3 kul czerwonych oraz 2 kul zielonych, 
wybrano bez zwracania 6 kul. Podaj kilka możliwych wyników tego losowania. 


MAPLE 


Następujące wyniki zostały wygenerowane przez program Maple: 
n, Nn, C, C, 2, z], 
n, n, Nn, N, C, Z|, 
n, n, n, C, C, Z|, 
n, n, n, N, C, Z|, 


N, N, C, C, Z, Zj, 


n, Nn, n, N, C, Z|, 


n, Nn, n, C, C, Z|. 


Ćwiczenie 2.7 W nawiązaniu do poprzedniego zadania: jakie jest prawdopodobień- 
stwo tego, że wśród wylosowanych kul: (1) są dokładnie 3 kule niebieskie? (2) są 
3 kule niebieskie, 2 kule czerwone (a więc 1 kula zielona)? 


MAPLE 


Oto odpowiedź na pierwsze pytanie: 


A oto odpowiedź na drugie pytanie: = 


Ćwiczenie 2.8 Rozwiąż zadanie poprzednie, zakładając, że losujemy kule że zwra- 


caniem. 
MAPLE 
6 53. 53 
3 5 
Odpowiedź na pierwsze pytanie: 106 1 
6) NP: 53.32.91 
3 2 1 27 
Odpowiedź na drugie pytanie: 106 201) 


Zadanie 2.1 Rzucono dwiema kostkami do gry. Niech A oznacza zdarzenie, że 
suma oczek jest większa niż 9, zaś B — zdarzenie, że na obu kostkach liczba oczek 
jest większa niż 3. Oblicz P(A), P(B), P(A) + P(B), P(AU B), P(A)P(B) oraz 
P(ANB). 


Zadanie 2.2 Oblicz prawdopodobieństwo tego, że skreślając 6 spośród 30 liczb tra- 
fimy: (a) dokładnie dwie, (b) co najmniej trzy, (c) co najwyżej cztery, (d) dokładnie 
pięć spośród pięciu liczb wylosowanych przez maszynę. 


Zadanie 2.3 Jakie jest prawdopodobieństwo tego, że w grupie 10 osobowej są do- 
kładnie dwie osoby obchodzące urodziny w marcu (dla uproszczenia przyjmij zało- 
żenie, że miesiąc = 1/12 roku.) 


Zadanie 2.4 Jakie jest prawdopodobieństwo tego, że w grupie 20 osobowej są do- 
kładnie dwie osoby obchodzące urodziny w tym samym dniu. 


Zadanie 2.5 Zbudować przestrzeń probabilistyczną opisującą eksperyment pole- 
gający na rzucie dwiema kostkami, przy czym znamy jedynie różnicę liczb oczek, 
jakie pojawiły się na obu kostkach. Uwzględnij następujące przypadki: (a) rozróż- 
niamy kostki, (b) nie rozróżniamy kostek. 


Zadanie 2.6 Wykaż własności 1 i 2 z twierdzenia 2.2, wykorzystując definicję prze- 
strzeni probabilistycznej. 

Wskazówka. Ad 1. Q = QUYXZ; Ø. Ad 2. Mając sumę skończoną zbiorów, można 
ją traktować jako sumę nieskończoną, dopisując nieskończenie wiele razy zbiór pusty. 


Zadanie 2.7 Wykaż własności 3, 4, 5 i 6 z twierdzenia 2.2. 
Wskazówka. B = AU (B \ A) oraz AUB=(ANB)U(BNA)U(ANB). 


Zadanie 2.8 Wykaż własność 7 z twierdzenia 2.2 (zacznij od najprostszego przy- 
padku dwóch zbiorów). 


Zadanie 2.9 Udowodnij, że P(NZo An) = 1, o ile P(An) = 1 dla wszystkich n. 


Zadanie 2.10 Do zdjęcia pozują cztery pary małżeńskie. Jaka jest szansa na to, 
że żadna żona nie stoi obok swojego męża, jeżeli wszyscy stoją w jednym rzędzie? 


Zadanie 2.11 Przez pustynię jedzie karawana złożona z pięciu wielbłądów. Na ile 
sposobów można zmienić kolejność wielbłądów w karawanie tak, aby przed żadnym 
wielbłądem nie szedł ten, co poprzednio? 


Zadanie 2.12 Jakie jest prawdopodobieństwo tego, że przy losowym wkładaniu n 
listów do zaadresowanych uprzednio n kopert: (a) każdy list trafi do właściwej koper- 
ty, (b) dokładnie r listów trafi do właściwych kopert (0 < r < n), (c) przynajmniej 
jeden list trafi do właściwej koperty? 
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Zadanie 2.13 Wykaż, że jeżeli w przestrzeni probabilistycznej wszystkie zdarze- 
nia elementarne mają takie samo prawdopodobieństwo dodatnie, to zbiór zdarzeń 
elementarnych jest skończony. 


Zadanie 2.14 W stawie pływa nieznana liczba ryb, w tym 20 ryb jest oznaczo- 
nych. Podczas odłowu 30 ryb znaleziono 5 znaczonych. Oszacuj liczbę ryb w stawie, 
zakładając, że jest to taka liczba N, dla której nasz wynik jest najbardziej prawdo- 
podobny. 

Komentarz. Otrzymana wielkość N służy jako przybliżenie prawdziwej liczby 
ryb w stawie. Obliczanie przybliżonych wielkości w powyższy sposób nazywa się 
estymacją metodą największej wiarygodności, a uzyskana wielkość — estymatorem 
największej wiarygodności. 


Zadanie 2.15 Skonstruować przestrzeń probabilistyczną, opisującą następujący 
eksperyment. Z urny zawierającej n czarnych i m niebieskich kul losujemy kolej- 
no k kul: (a) bez zwracania, (b) ze zwracaniem; interesuje nas liczba wyciągniętych 
niebieskich kul. 


Zadanie 2.16 Wylosowano dwie liczby a i b z odcinka (0, 1). Oblicz prawdopodo- 
bieństwo tego, że odcinek o końcach a, b jest dłuższy: (a) od odcinka (0, 3), (b) od 
odcinka o lewym końcu równym zeru. 


Zadanie 2.17 Wylosowano liczby a, b i c z odcinka (0, 1). Oblicz prawdopodobień- 
stwo tego, że: (a) a+b+c < 1, (b) z odcinków o długościach a, b i c można zbudować 
trójkąt. 


Zadanie 2.18 Z urny zawierającej 5 kul niebieskich, 3 kule czarne oraz 2 kule 
zielone losujemy 4 kule. Oblicz prawdopodobieństwo tego, że: (a) otrzymamy 2 kule 
niebieskie, 1 kulę czarną i 1 kulę zieloną, (b) otrzymane kule nie będą czerwone, 
(c) otrzymamy kule tylko dwóch kolorów, (d) otrzymamy kule w trzech kolorach. 
W każdym przypadku rozważ zarówno losowanie ze zwracaniem, jak i losowanie bez 
zwracania. 
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Rozdział 3 


Prawdopodobieństwo 
warunkowe i niezależność 


3.1  Prawdopodobieństwo warunkowe 


Pojęcie prawdopodobieństwa warunkowego jest znane z kursu szkolnego, tak więc 
nie wymaga komentarza następująca definicja: 


3.1 DEFINICJA 
Dana jest przestrzeń probabilistyczna (Q,>,P) oraz zdarzenie A € ©, 
przy czym P(A) > 0. Dla dowolnego zdarzenia B € © określamy jego 
prawdopodobieństwo warunkowe P(B|A) wzorem: 


P(BNA) 


Ba (3.1) 


P(B|A) = 


Jak łatwo się przekonać, funkcja P(:|A) jest miarą probabilistyczną na > po- 
siadającą tę właściwość, że dwa zbiory mające jednakowe przecięcia ze zbiorem 4, 
mają także taką samą miarę. 


3.1.1  Prawdopodobieństwo całkowite 


Z prawdopodobieństwami warunkowymi spotykamy się najczęściej przy oblicza- 
niu tak zwanego prawdopodobieństwa całkowitego. Mówi o tym następujące proste, 
lecz bardzo ważne twierdzenie: 


3.2 TWIERDZENIE — Prawdopodobieństwo całkowite 
Dana jest przestrzeń probabilistyczna (Q, >, P) oraz 
zdarzenia A1,..., An € > spełniające warunki: 


(i) P(A,) > 0 dla każdego i = 1,...,n, 
(ii) 4,04, = Ø, dla wszystkich i £ j, 
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(iii) A1U...U4A,=Q. 


Wtedy dla każdego zdarzenia B € © zachodzi wzór: 


n 


P(B) = Y P(B|A)P(A)). 


i=1 
Dowód. Ponieważ 
B=BNQ=BN(UJ A;) = UGBNA)). 
i=1 i=1 
mamy 
P(B) = Ș\ P(B N 4;) = X` P(B|A;)P(A)) 
i=1 1=1 

3.3 UWAGA 


Powyższe twierdzenie można wypowiedzieć tak: mając zespół istotnych warunków, 
które się wzajemnie wykluczają, ale których alternatywa jest zdarzeniem pewnym, 
możemy obliczyć prawdopodobieństwo każdego zdarzenia, o ile tylko znamy odpowied- 
nie prawdopodobieństwa warunkowe oraz prawdopodobieństwa samych warunków. 


Z praktycznego punktu widzenia, wzór na prawdopodobieństwo całkowite jest 
wygodny także i z tego powodu, że stosując go nie musimy na ogół wyznaczać 
przestrzeni probabilistycznej. Rozumiemy raczej, że taka przestrzeń istnieje i to nam 
w zupełności wystarcza. 


3.4 PRZYKŁAD 
Przed konkursem ogłoszono listę 200 pytań z dziedziny Dı, 100 pytań z dziedziny 
Də oraz 100 pytań z dziedziny D3. Umiemy odpowiedzieć na 150 pytań z dziedziny 
Dı, na wszystkie pytania z dziedziny Do oraz na 80 pytań z dziedziny D3. Jakie jest 
prawdopodobieństwo, że podczas konkursu odpowiemy na losowo zadane pytanie? 
Mamy tutaj alternatywę trzech wykluczających się warunków Dy, Do i D3 pole- 
gających na tym, że zadane pytanie pochodzić będzie z odpowiedniej dziedziny. Jest 
to alternatywa pewna, to znaczy nie istnieją inne możliwości oprócz tych trzech. 
Chcemy obliczyć prawdopodobieństwo zdarzenia B, polegającego na udzieleniu po- 
prawnej odpowiedzi na otrzymane pytanie. Z treści zadania wynika jednak, że znamy 
prawdopodobieństwa warunków oraz prawdopodobieństwa warunkowe: 


200 1 100 1 100 1 

P(D,) = = a> = = 
(Du) 400 2 (Dz) 400 4 (Ds) 400 4 
150 3 100 80 4 
PBDijeS => PBD A= -=jl PBD] i" 
(B|D1) = 99 7 2 PAIP) = 199751 PBID) = 5975 
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Z twierdzenia o prawdopodobieństwie całkowitym otrzymujemy więc: 


38: 1 1 41 33 


=>: 415+. = = 0.825. 
ROCA a A 


P(B) 


Mamy zatem 82.5-procentową szansę udzielenia poprawnej odpowiedzi na zadane 
pytanie. 


3.5 UWAGA 
Twierdzenie o prawdopodobieństwie całkowitym można w oczywisty sposób sformu- 
łować (i udowodnić) dla przeliczalnego ciągu zdarzeń Aj, A2, A3, ... (ćwiczenie). 


3.1.2 Wzór Bayesa 
Możemy teraz podać tak zwany wzór Bayesa. 


3.6 TWIERDZENIE — Bayes 
Przy założeniach twierdzenia 3.2, zachodzi następująca równość: 


_ _ P(B|44)P(45) 
P(A,|B) = 7, P(B|A;)P(A;) 


dla każdego k=|1,...,n. 


Dowód. 

P(B) Xi P(B|A.)P(A;) 

Twierdzenie to budziło z początku pewne kontrowersje. Mianowicie, zdarzenia 4; 

są często w zastosowaniach traktowane jako przyczyny, zaś zdarzenie B jako skutek. 

W tej terminologii wzór na prawdopodobieństwo warunkowe (definicja 3.1) moż- 

na rozumieć w sposób następujący: znając prawdopodobieństwo przyczyny można, 

o ile ona zaistnieje, obliczyć prawdopodobieństwo skutku — jest to intuicyjnie jasne. 

Tymczasem twierdzenie Bayesa pozwala wyliczyć prawdopodobieństwo przyczyny, 

o ile już znamy jej skutek. To powodowało pewne wątpliwości, niemniej na gruncie 
naszej teorii twierdzenie Bayesa jest oczywiście jak najbardziej poprawne. 


3.7 PRZYKŁAD - kontynuacja przykładu 3.4 

Na drugi dzień po egzaminie pamiętamy tylko to, że dostaliśmy jedno pytanie oraz 
to, że zdaliśmy egzamin. Jakie jest prawdopodobieństwo tego, że odpowiadaliśmy 
na pytanie z dziedziny D1? 


Pamiętając o poprzednich oznaczeniach możemy nasze zadanie sformułować na- 
stępująco: oblicz prawdopodobieństwo warunkowe P(D;|B). Z Twierdzenia Bayesa 
otrzymujemy natychmiastową odpowiedź: 

P(BN Dı) _ P(B|D1)P(DH) _ 4:3 


5 
P(D;|B) = = = A = x045. 
(D1|B) P(B) P(B) aj 7. 
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3.2 Zdarzenia niezależne 


Pojęcie niezależności (statystycznej) jest podstawowym pojęciem w rachunku praw- 
dopodobieństwa — można powiedzieć, że pojęcie to wyodrębnia rachunek prawdo- 
podobieństwa z teorii miary. Najprostszą postać pojęcie to posiada w przypadku 
dwóch zdarzeń: zdarzenia A i B powinny być, jak podpowiada intuicja, uważane za 
niezależne, jeśli dla każdego z nich prawdopodobieństwo warunkowe względem tego 
drugiego nie zależy od warunku, czyli P(A|B) = P(A) oraz P(B|A) = P(B). Każda 
z tych równości oznacza, że: 


P(AN B) = P(A) - P(B). 


Właśnie ta równość służy za definicję niezależności dwóch zdarzeń; obejmuje ona 
jednak również przypadki, gdy P(A) = 0 lub P(B) =0. 

Podamy teraz formalną definicję niezależności dla dowolnej, skończonej liczby 
zdarzeń. 


3.8 DEFINICJA 
Zdarzenia Aq,..., An są niezależne, jeżeli dla każdego podciągu Ak,,..., Ak 
zachodzi: 


CA 


P(Ab, N... N Ak) = Pd Jes PA). 


3.9 PRZYKŁAD 

Podamy teraz przykłady zdarzeń niezależnych oraz zdarzeń zależnych. Przypuśćmy, 
że rzucamy dwiema kostkami. Niech A oznacza wypadnięcie „szóstki” na pierwszej 
kostce, B — wypadnięcie liczby nieparzystej na drugiej kostce, zaś 5 — wypadnięcie 
w sumie 10 oczek na obu kostkach. Intuicja podpowiada nam, że: 


(1) Ai B są niezależne — wynik na pierwszej kostce nie ma nic wspólnego z wyni- 
kiem na drugiej kostce, 


(2) Ai S są zależne — „szóstka” na pierwszej kostce oznacza, że suma oczek na 
obu kostkach musi być większa niż 6, a więc wiadomość o wypadnięciu liczby 
6 zwiększa szansę zajścia zdarzenia S, 


(3) Bi S są zależne — wiadomość o wypadnięciu liczby nieparzystej 1, 3 lub 5 na 
drugiej kostce zmniejsza trochę szansę tego, że w sumie wypadnie 10. 


MAPLE 


Aby formalnie uzasadnić te intuicje, zbudujemy przestrzeń probabilistyczną opi- 
sującą nasz eksperyment. Mamy oczywiście do czynienia ze schematem klasycz- 
nym, przy czym zbiorem 0 jest tutaj zbiór złożony z 36 par liczb (w1,w2), gdzie 
w1,wą = 1,...,6. Łatwo teraz policzyć, ile elementów wchodzi w skład zdarzeń 4, 
B i S oraz ich iloczynów AN B, AN Si BNS. Dzieląc te liczby przez 36, mamy: 
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ad. (1). P(ANB)=z=-,, P(4A)P(B)=g:ż=75. 
ad. (2). P(AN S) = $, P(A)P(S)=$: z: = A. 
ad. (3). P(BNS)=s, P(B)P(S)=35:;5:= x. 


Jak widać, powyższe obliczenia potwierdzają nasze intuicje. 


Definicję niezależności można rozszerzyć na przypadek nieskończonego ciągu zda- 
rzeń, co w dalszej części rozważań będzie miało istotne znaczenie. 


3.10 DEFINICJA 
Zdarzenia A+, Ao, A3,... są niezależne, jeżeli dla każdego n > 2 zdarzenia 
Aq,..., An sq niezależne. 


Należy zauważyć, że w na ogół spotykamy się z takimi sytuacjami, w których 
wiemy (a dokładniej zakładamy), że pewne zdarzenia są niezależne. Możemy wtedy 
stosować wzory występujące w definicji niezależności lub inne twierdzenia bazujące 
na tej definicji. 


3.2.1 Iloczyn kartezjański 


Niezależność zdarzeń łączy się z pojęciem iloczynu kartezjańskiego przestrzeni 
probabilistycznych. My rozważymy tutaj jedynie najprostszą sytuację. 

Niech będą dane dwie przestrzenie probabilistyczne (04, 24, P+) oraz (Q2, Ha, P2). 
Niech Q = Qı x Q2 oznacza iloczyn kartezjański zbiorów Qı i Q2, czyli: 


Q = {(w1, w2) : w1 E Q1, w2 E Q2}. 


Można teraz zbudować o-algebrę > na zbiorze Q oraz miarę probabilistyczną P: Q — 
R (jest to dość skomplikowana procedura!) taką, że dla każdych dwóch zdarzeń 
A EX i Ao E€ Że mamy pewność, że Ai X A> € X oraz że: 


P(A: X Ap) = Pı (A) P>(A2). 


Stosujemy często następujące oznaczenie: P = Pi x P>. 

Dla wyrobienia intuicji proponujemy wyobrazić sobie iloczyn kartezjański dwóch 
odcinków Qı = Q2 = [0,1], którym jest oczywiście kwadrat o boku równym jeden. 
Jeżeli A; C Qı oraz Ao C (o są odcinkami, to ich iloczyn kartezjański jest pro- 
stokątem o polu równym iloczynowi długości tych odcinków. Odpowiada to właśnie 
powyższemu wzorowi, o ile P(A,) i P(A2) są długościami, zaś P(A, x Ao) — po- 
lem. Rzeczywiście, w ogólnej sytuacji konstrukcja miary P, na bazie miar P i P>, 
odpowiada sposobowi określania pola figury płaskiej przy użyciu pojęcia długości 
odcinka. Zaznaczmy jeszcze, że wielu podzbiorów kwadratu (na przykład koła) nie 


! Jako X bierze się najmniejszą o-algebrę zawierającą wszystkie iloczyny kartezjańskie A, x Aa, 
gdzie A; € Ży i Ao € X2, a następnie dowodzi się w żmudny sposób, że istnieje dokładnie jedna 
miara P spełniająca żądane warunki. 
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da się przedstawić jako iloczynów kartezjańskich, a mimo to mają one dobrze okre- 
ślone pola, co odpowiada temu, że miara P jest określona dla dużo szerszej klasy 
zdarzeń niż iloczyny kartezjańskie A; x Ap. 

Innym przykładem iloczynu kartezjańskiego jest przestrzeń probabilistyczna opi- 
sująca, omawiany już, eksperyment rzutu dwiema kostkami. 

Pojęcie iloczynu kartezjańskiego przestrzeni probabilistycznych można w prosty 
sposób zdefiniować także w przypadku skończenie wielu przestrzeni, a nawet (tutaj 
jest trudniej) w przypadku nieskończenie wielu przestrzeni probabilistycznych. 


Związek iloczynów kartezjańskich z pojęciem niezależności wyjaśnia następujący: 


3.11 PRZYKŁAD 

Rozważmy dwie przestrzenie probabilistyczne (Q1, 24, P+) i (Q2, £2, P2) oraz niech 
A € X i Ao E€ X2 będą dowolnymi zdarzeniami. Wtedy zdarzenia A = Ay x Q2 
oraz B = Q; x Ao są niezależne w iloczynie kartezjańskim (Q, X, P) tych przestrzeni, 
gdyż z definicji miary P = Pı x P mamy: 


P(AN B) = P(A1 x A2) = P4(41)P>(42) = P(A)P(B). 


Uogólnienie tego przykładu dla skończonego oraz przeliczalnego iloczynu kartezjań- 
skiego przestrzeni probabilistycznych nie jest trudne. 


Iloczyn kartezjański dwóch przestrzeni  probabilistycznych stanowi 
więc naturalny model do opisu 2-etapowego eksperymentu, w którym etapy są od 
siebie niezależne. 


Warto zaznaczyć, że rozważa się także przestrzenie probabilistyczne, w których 
zbiór zdarzeń jest iloczynem kartezjańskim dwóch lub więcej zbiorów zdarzeń, nato- 
miast miara probabilistyczna nie jest iloczynem kartezjańskim odpowiednich miar. 
Taka sytuacja występuje najczęściej wtedy, gdy opisujemy dwuetapowy lub wielo- 
etapowy eksperyment, przy czym poszczególne etapy są od siebie zależne. 


3.2.2 Schemat Bernoulliego 


Pojęcie niezależności odgrywa podstawową rolę w konstrukcji tak zwanego sche- 
matu Bernoulliego. 

Wyobraźmy sobie, że wielokrotnie powtarzamy pewien eksperyment, przy czym 
spełnione są następujące warunki: 


1. każdy eksperyment może dać dokładnie dwa różne wyniki — mówi się odpo- 
wiednio o sukcesie oznaczanym przez „l” oraz o porażce oznaczanej przez „0”, 


2. prawdopodobieństwo sukcesu w każdym eksperymencie jest zawsze takie samo 
— oznaczamy to prawdopodobieństwo przez p (w takim razie prawdopodobień- 
stwo porażki w każdym eksperymencie wynosi q = 1 — p), 


3. eksperymenty są niezależne od siebie. 
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Powyższe warunki są spełnione na przykład w przypadku, gdy rzucamy wielo- 
krotnie kostką do gry i określimy, co rozumiemy przez porażkę, a co przez sukces 
(mają być dokładnie dwa wyniki eksperymentu). Jeżeli za sukces uważamy wypad- 
nięcie „szóstki”, a za porażkę wypadnięcie każdej innej liczby, mamy p = z. Bardziej 
ogólnym przykładem może być losowanie ze zwracaniem omówione w poprzednim 
module (patrz strona 39) — trzeba wtedy oczywiście znowu określić, co uważamy za 
sukces, a co za porażkę. 

Możemy skonstruować przestrzeń probabilistyczną stanowiącą matematyczny mo- 
del opisanej sytuacji. 

Załóżmy, że wykonujemy n eksperymentów. Każdemu z nich odpowiada bardzo 
prosta przestrzeń probabilistyczna (Q;, >;, P;), gdzie Q; = 40,1), >; jest o-algebrą 
wszystkich podzbiorów Q; (są jedynie cztery takie podzbiory), natomiast P; jest 
jednoznacznie określone równościami: 


F;(11)) = p oraz F;(£0)) = 1-p dla i=1...n. 


Niezależność poszczególnych eksperymentów oraz omówiony już poprzednio zwią- 
zek iloczynu kartezjańskiego z niezależnością sugerują, że nasz model może być wła- 
śnie iloczynem kartezjańskim. Oznaczmy więc przez (Q, P(Q), P) n-krotny iloczyn 
kartezjański powyższych przestrzeni, czyli: 


Q = {w = (Ga sly) wi E Qi}, 


P(w... , Wn) = Pi(vi) ew Plon) 


oraz dla dowolnego A C Q8: 


P(A)= X P(w). 


w:wEA 


Tak skonstruowaną przestrzeń nazywamy schematem Bernoulliego. 

Podamy teraz rozwiązanie standardowego problemu, polegającego na obliczeniu 
prawdopodobieństwa uzyskania dokładnie k sukcesów podczas n eksperymentów, 
przeprowadzanych zgodnie ze sformułowanymi powyżej warunkami. 

Niech A będzie interesującym nas zdarzeniem. Elementami A są więc ciągi w = 
{w1,..., Wm}, w których dokładnie k elementów stanowią „1”, a pozostałe n — k 
elementów stanowią „0”. Dla każdego takiego w mamy więc: 


Pasg (lp 5 
Tak więc: 
P(A)= E Pos E a-p. 


w:wEA w:wEA 


2Aby zapis był czytelniejszy, opuszczamy kilka par nawiasów, które formalnie powinny się poja- 
wić. 
3Przypominamy, że P(Q) oznacza o-algebrę wszystkich podzbiorów Q. 
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Wystarczy teraz tylko znać liczbę wszystkich elementów zbioru A. Liczba ta jest 
jednak równa liczbie wszystkich podzbiorów k-elementowych wybranych ze zbioru 
n-elementowego — każdy taki zbiór określa k (spośród n) pozycji, przeznaczonych 
dla „sukcesów”. Mamy więc ostatecznie: 


P(A) = (r) pil - py. (3.2) 


MAPLE 


3.3 Cwiczenia i zadania 


Ćwiczenie 3.1 Długoletnie doświadczenia wskazują na to, że część pisemna pew- 
nego egzaminu jest istotnie trudniejsza — 60% zdających, od części ustnej — 95% 
zdających. Aby zdać egzamin, trzeba pozytywnie zaliczyć obie części; obowiązuje przy 
tym zasada, że student, który nie zaliczył części pisemnej, nie jest dopuszczony do 
części ustnej. Oblicz prawdopodobieństwo tego, że osoba, która nie zdała egzaminu, 
nie zaliczyła części pisemnej. 


Warunkami są tutaj dwa zdarzenia Z, oraz Np, oznaczające odpowiednio zali- 
czenie oraz niezaliczenie części pisemnej. Zdarzenia te są oczywiście rozłączne, a ich 
alternatywa jest zdarzeniem pewnym. Treść zadania oznacza, że znamy ich prawdo- 
podobieństwa, mianowicie: 


P(Z,) = 0.6 oraz P(N,) = 0.4. 


Chcemy obliczyć prawdopodobieństwo warunkowe P(N„|N), gdzie N oznacza nie- 
zdanie egzaminu. Znamy jednak prawdopodobieństwa warunkowe: 


P(N|Z,) = 0.05 oraz P(N|N,)=l. 
Możemy więc kolejno wyliczyć: 
P(N) = P(N|Z,)P(Z,) + P(N|N„)P(N,) = 0.05 : 0.6 + 1 - 0.4 = 0.43, 
a dalej interesujące nas prawdopodobieństwo: 


P(N,|N) = R = rę ~ 0.93.4 


4Wynik ten może zwrócić uwagę studentów na konieczność lepszego przygotowywania się do 
części pisemnej. Jakkolwiek innym, prostszym rozwiązaniem mogłoby być po prostu zlikwidowanie 
tej niewygodnej części egzaminu. 
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3.12 UWAGA 

W definicji prawdopodobieństwa warunkowego zakładaliśmy, że prawdopodobieństwo 
warunku A jest dodatnie. Było to konieczne dla sensowności wzoru (3.1). Jednak są 
sytuacje, w których prawdopodobieństwo warunku wynosi 0, a mimo to prawdopodo- 
bieństwo warunkowe ma sens. Można tak (w pewnym sensie) uogólnić definicję praw- 
dopodobieństwa warunkowego, aby objęła ona przypadki, w których prawdopodobień- 
stwa warunków równają się żeru. I chociaż tego tutaj nie robimy, w kolejnym ćwi- 
czeniu podajemy przykład takiej sytuacji. 


Ćwiczenie 3.2 Z odcinka (0,1) losujemy liczbę a, a następnie z odcinka (0,a) lo- 

sujemy liczbę b. „Oblicz” prawdopodobieństwo tego, że b < z, pod warunkiem, že 
1 

a = 2* 


Intuicja podpowiada, że żądane prawdopodobieństwo wynosi: 


1h. 22 


32 3 


Jednak prawdopodobieństwo warunku a = $ jest równe 0. 


Ćwiczenie 3.3 Bezpieczeństwo windy zapewniają, działające niezależnie od siebie, 
dwie liny o znanych niezawodnościach, odpowiednio 99% i 95%. Ile wynosi prawdo- 
podobieństwo bezpiecznego przejazdu tą windą (to znaczy, że co najmniej jedna lina 
się nie zerwie)? 


Niech A; oraz Ao oznaczają zdarzenia polegające na tym, że odpowiednie liny 
nie ulegną zerwaniu. Wiemy więc, że P(A1) = 0.99 i P(A2) = 0.95 oraz zakładamy, 
że zdarzenia Ay i Ao są niezależne — interesuje nas natomiast P(A U A2). Zgodnie 
z twierdzeniem 2.2 (patrz własność 6) mamy: 


P(A U Ao) = P(A;) + P(Ao) = P(A N Ao), 
tak więc, korzystając z niezależności: P(A; N A2) = P(44)P(A>), otrzymujemy: 


P(A U Ao) = 0.99 + 0.95 — 0.99 - 0.95 = 0.9995. 


Ćwiczenie 3.4 Powróćmy do ćwiczenia 3.1 — występują tam dwa etapy: część pi- 
semna i część ustna, opisane przestrzeniami probabilistycznymi: (Qi, Xi, P;), i = 1,2. 
Zbiory zdarzeń dla etapu pierwszego oraz drugiego są określone następująco: 


(1 = Q = {0, 1), 
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natomiast miary probabilistyczne zadane są przez warunki: 
P,(£1)) = 0.6, Pi({0}) = 0.4, P>(f1)) = 0.95, i P>(£0)) = 0.05. 


Na iloczynie kartezjańskim Q = Qı x Qa określamy miarę P w następujący (natu- 
ralny) sposób: 


P(4(1,1))) = 0.6-0.95 = 0.57, P(£(1,0))) = 0.6 - 0.05 = 0.03, 


P(4(0, 1))) = 0.4-:0=0 oraz P({(0,0)}) = 0.4 -1 = 0.4. 
Wyraźnie widać, że P £ Pi x Po. 


Zauważmy teraz, że zdarzenia określone w ćwiczeniu 3.1 są odpowiednio równe: 


Z, = {1} x Q2, Np = {0} x Q2 i N = {(1,0), (0, 1), (0,0)}. 


Zadanie 3.1 Rozdano talię złożoną z 24 kart, pomiędzy graczy A, B, C i D. Niech 
X oznacza, że gracz A ma dokładnie 5 pików i niech Y oznacza, że gracz B ma cztery 
asy. Oblicz: P(X), P(Y), P(X) + P(Y), P(XUY), P(X)P(Y), P(XNY), P(XIY) 
oraz P(Y|X). 


Zadanie 3.2 Oblicz prawdopodobieństwo tego, że rzucając losowo monetą orzeł 
po raz pierwszy wypadnie: (a) za trzecim razem, (b) nie wcześniej niż za szóstym 
razem, (b) nigdy nie wypadnie. 


Zadanie 3.3 A powiedział, że B powiedział, że Č skłamał. Jakie jest prawdopo- 


dobieństwo tego, że C istotnie skłamał, jeżeli każdy z tej trójki mówi prawdę w 2 


przypadków. 


Zadanie 3.4 Z urny zawierającej 4 niebieskie i 6 czarnych kul losujemy kolejno po 
jednej kuli. 


1. Oblicz prawdopodobieństwo tego, że w trzecim losowaniu kula będzie niebie- 
ska. 


2. Wiedząc, że w drugim losowaniu kula jest niebieska, oblicz prawdopodobień- 
stwo tego, że w pierwszym losowaniu także była kula niebieska. 


3. Wiedząc, że w trzecim losowaniu kula jest niebieska, oblicz prawdopodobień- 
stwo tego, że w pierwszym i drugim losowaniu były niebieskie kule. 


Rozważ: (a) losowanie ze zwracaniem, (b) losowanie bez zwracania. 
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Zadanie 3.5 Z urny zawierającej 5 kul niebieskich i 5 kul czarnych wylosowano bez 
zwracania pięć kul, a następnie wylosowano jedną kulę w kolorze niebieskim. Jakie 
jest prawdopodobieństwo tego, że wszystkie kule pozostałe w urnie są: (a) niebieskie, 
(b) czarne? 

Uwaga. Są co najmniej dwa (istotnie różne) sposoby rozwiązywania tego zadania. 


Zadanie 3.6 W schemacie klasycznym, opisującym rzut dwiema kostkami do gry, 
podać przykłady zdarzeń A oraz B (o ile istnieją) takich, że: 


1. Ai B są niezależne, 

2. Ai B są rozłączne, 

3. Ai B są niezależne oraz rozłączne, 

4. Ai B nie są sobie równe oraz P(A|B) = 1, 
5. P(A|B)=0, 

6. P(A|B) =P(A), 

7. Ai B są rozłączne oraz P(A|B) >0. 


Zadanie 3.7 Rzucamy trzema kostkami do gry. Czy następujące zdarzenia Ai B 
są niezależne: 


1. A- suma oczek na kostkach jest większa niż 10, B — na jednej z kostek wypadła 
„jedynka”, 


2. A — na pierwszej lub drugiej kostce wypadła „szóstka”, B — na trzeciej kostce 
wypadła „jedynka”, 


3. A — na wszystkich kostkach wypadła nieparzysta liczba oczek, B — na trzeciej 
kostce wypadła liczba oczek większa niż 3? 


Oblicz P(A|B), P(B|A) oraz P(AUB). 


Zadanie 3.8 Wiemy, że w jednej urnie są dwie kule czarne i cztery niebieskie, 
w drugiej — trzy czarne i trzy niebieskie. Nie wiemy jednak, jak rozpoznać odpo- 
wiednią urnę. Przekładamy losowo dwie kule z jednej urny do drugiej, a następnie 
przekładamy losowo dwie kule z urny drugiej do pierwszej. (a) Jakie jest prawdo- 
podobieństwo tego, że w każdej urnie są teraz po trzy niebieskie i trzy czarne kule? 
(b) Oblicz to samo prawdopodobieństwo wiedząc, że co najmniej podczas jednego 
przekładania obie kule miały ten sam kolor. 


Zadanie 3.9 Mąż i żona zawarli umowę zawierającą następujące warunki: 


1. jeżeli w pewnym dniu naczynia myje mąż, to o tym, kto myje naczynia w dniu 
następnym, decyduje rzut monetą, 
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2. jeżeli w pewnym dniu naczynia myje żona, to w dniu następnym naczynia myje 
mąż, 


3. w pierwszym dniu umowy o tym, kto myje naczynia, decyduje rzut monetą. 


Oblicz: (a) prawdopodobieństwo tego, że w trzecim dniu umowy naczynia myje mąż, 
(b) prawdopodobieństwo tego, że w trzech pierwszych dniach umowy naczynia mył 
mąż, o ile wiadomo, że mył on naczynia w dniu czwartym, (c) prawdopodobieństwo 
tego, że w pierwszym tygodniu umowy mąż i żona myli naczynia na przemian, 
(d) lime Pn, gdzie pn jest prawdopodobieństwem tego, że mąż myje naczynia 
w n-tym dniu umowy. 


Zadanie 3.10 Podać (nietrywialny) przykład zdarzeń A, B i C, które są zależne 
(to znaczy, że nie są niezależne), ale P(ANBNC) =P(A)P(B)P(C). 


Zadanie 3.11 Przed konkursem ogłoszono listę 200 pytań z dziedziny Dı, 100 py- 
tań z dziedziny Do oraz 100 pytań z dziedziny D3. Umiemy odpowiedzieć na 150 
pytań z dziedziny Dı, na wszystkie pytania z dziedziny Da oraz na 80 pytań z dzie- 
dziny D3. Jakie jest prawdopodobieństwo tego, że podczas konkursu odpowiemy na 
co najmniej cztery spośród pięciu wylosowanych pytań? 


Zadanie 3.12 Podać przykład zależnych zdarzeń A, B i C, z których każde dwa 
są niezależne. 
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Rozdział 4 


Rozkłady prawdopodobieństwa 
i zmienne losowe 


4.1 Rozkład prawdopodobieństwa 


Prawie wszystkie wielkości, z którymi mamy do czynienia, mają (mniej lub bar- 
dziej) losowy charakter. Wzrost pierwszej osoby spotkanej po wyjściu z domu, oce- 
na otrzymana na najbliższym egzaminie, cena kostki masła w najbliższym sklepie 
oraz wiele innych wielkości stanowi przykład tak zwanych zmiennych losowych. Każ- 
da taka zmienna ma swój specyficzny charakter. Wzrost mężczyzny może przybierać 
wszystkie wartości z przedziału (150, 230), a nawet spoza tego przedziału, przy czym, 
przykładowo, przedział (174, 176) jest bardziej prawdopodobny niż następujące prze- 
działy o tej samej długości: (154, 156) czy (210,212). Podobnie ocena z najbliższego 
egzaminu może przyjmować skończenie wiele wartości, na przykład 2, 3, 4 lub 5, przy 
czym dla danego studenta (i egzaminatora) nie są one na ogół jednakowo prawdo- 
podobne — dla stypendysty MEN oceny 5 i 4 są dużo bardziej prawdopodobne niż 
3, zaś ocena 2 jest niemal nieprawdopodobna. Tak więc każda zmienna losowa ma 
swój rozkład, który najłatwiej jest przedstawić graficznie. Przykładowo, hipotetycz- 
ny rozkład zmiennej losowej będącej wzrostem mężczyzny mógłby odpowiadać polu 
pod wykresem funkcji z następującego rysunku, przy czym pole całkowite figury 
ograniczonej osią 0X i wykresem funkcji wynosi 1, zaś prawdopodobieństwo (na 
przykład) tego, że wzrost ten zawiera się w przedziale (180, 185), jest równe polu 
zakreskowanej figury. 
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A> x 
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Natomiast rozkład spodziewanej oceny dla dobrego studenta może wyglądać tak: 


MAPLE 


0.44 


0.24 


0 


ndst dost db bdb 


zaś dla słabszego studenta — nieco inaczej: 


0.44 


0.24 


0 


ndst dost db bdb 


Tutaj prawdopodobieństwo uzyskania danej oceny odpowiada długości danego od- 
cinka. 
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Każdy rozkład zmiennej losowej można scharakteryzować pewnymi standardo- 
wymi parametrami, co z kolei umożliwia porównywanie rozkładów między sobą. 
Ważnym zagadnieniem jest także badanie i mierzenie współzależności zmiennych lo- 
sowych — wiadomo, że wzrost i waga studenta są ze sobą silniej związane niż wzrost 
studenta i jego ocena na najbliższym egzaminie. 


4.2 Miary probabilistyczne w R” 


Prosta rzeczywista, płaszczyzna i ogólniej przestrzeń IR”, są często traktowane jako 
zbiór zdarzeń elementarnych 0. pewnej przestrzeni probabilistycznej. Przyjmuje się 
najczęściej, że o-sigma algebrę © stanowią zbiory borelowskie B(R”) (patrz przykład 
2.4), natomiast miary P określone na tej o-algebrze mogą być bardzo różne. Mówi 
o tym następująca: 


4.1 DEFINICJA — rozkład prawdopodobieństwa 
Rozkładem prawdopodobieństwa (n-wymiarowym) nazywamy miarę P ta- 
ką, że trójka (R”, B(R”),P) jest przestrzenią probabilistyczną. 


Omówimy teraz dwa podstawowe rodzaje rozkładów n-wymiarowych: rozkłady 
dyskretne oraz rozkłady ciągłe. Chociaż najczęściej mamy do czynienia z takimi 
właśnie rozkładami, należy wyraźnie podkreślić, że nie wyczerpują one wszystkich 
możliwych rozkładów. 


4.3 Rozkład dyskretny 


Zaczniemy od rozkładu dyskretnego, poznanego już w szkole. 


4.2 DEFINICJA — Rozkład dyskretny 
Rozkład n-wymiarowy P nazywamy rozkładem dyskretnym, jeżeli istnieje 
zbiór borelowski K C R” taki, że: 


P(K)=1 oraz x€ K > P(a)>0. 


4.3 UWAGA 

Występujący w powyższej definicji zbiór K jest skończony lub przeliczalny. Żeby 
to stwierdzić, zauważmy, że K można przedstawić jako przeliczalną sumę zbiorów 
skończonych. Dokładniej: 


OO 
K =|] K;, 
i=1 
gdzie 


K; ={xz € R”: P(x) > =}. 


=.| H 


Widzimy, że 1 > P(K;) > 4+K,:3, a więc #K; < i. 
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Z powyższej uwagi wynika, iż możemy zbiór K ustawić w ciąg, powiedzmy K = 
{xr;: i= 1,..., m}, gdzie m jest liczbą naturalną lub m = o, i oznaczyć p; = P(u;). 
Mamy wtedy: 

m 

5 pi=1l1 oraz p; > 0 dla wszystkich i. 

i=1 
Zdefiniowane w ten sposób ciągi {x;} i {p:i} wyznaczają jednoznacznie rozkład P. 
Mianowicie, dla każdego zbioru borelowskiego A mamy P(A) = P(ANK) (dlaczego?) 
i dalej: 

P(A)= S p. (4.1) 
ixiE A 

W związku z powyższym, często używa się sformułowania: rozkład dyskretny 
zadany przez ciągi {x;} i {pi}. 

Przykładami rozkładów dyskretnych są wspomniane już rozkłady przewidywanej 
oceny, jaką otrzyma student na zbliżającym się egzaminie. Są one skupione w punk- 
tach 2, 3, 4 i 5, jak (przykładowo) pokazano na ostatnich dwóch rysunkach. 

Podamy teraz dwa inne, na pozór trochę banalne przykłady rozkładów dyskret- 
nych. 


4.4 PRZYKŁAD — Rozkład jednopunktowy 
Rozkład P jest jednopunktowy, jeżeli istnieje punkt c € R” taki, że P(c) = 1. 


MAPLE 


4.5 PRZYKŁAD -— Rozkład dwupunktowy 
Rozkład P jest rozkładem dwupunktowym, jeżeli istnieją punkty a, b € R” oraz 
liczby p,q € (0,1) takie, że p + q = 1 oraz: 


P(a)=q i P(b)=p. 


Najczęściej mówiąc o rozkładzie dwupunktowym, mamy na myśli rozkład jednowy- 
miarowy skupiony w punktach a = 0 i b = 1 - będziemy go oznaczać jako (0,1,p). 


MAPLE 


4.6 PRZYKŁAD -— Rozkład dwumianowy 

Wiemy już, że zajście k sukcesów w schemacie Bernoulliego z n doświadczeniami 
wyraża się wzorem (3.2). Mamy tu do czynienia z rozkładem prawdopodobieństwa 
skupionym w punktach 0, 1,...,n, przy czym: 


P(k) = (r) Hisp "dle ke0 Im 
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4.4 Rozkład ciągły 


Drugą bardzo ważną klasą rozkładów są rozkłady ciągłe (nazywane przez niektó- 
rych rozkładami absolutnie ciągłymi, co z formalnego punktu widzenia jest bardziej 
poprawne, niemniej mało używane). 


4.7 DEFINICJA — Rozkład ciągły 
Rozkład n-wymiarowy P nazywamy rozkładem ciągłym, jeżeli istnieje 
funkcja całkowalna f: R” — R taka, że dla każdego zbioru borelowskiego 
ACR: 
P(A)= | F@) de, (42) 


gdzie [, f(x) dx oznacza całkę wielokrotną po zbiorze A z funkcji f. Funk- 
cję f nazywamy wówczas gęstością rozkładu P. 


Przykład rozkładu ciągłego pokazano na rysunku na stronie 62. Prawdopodo- 
bieństwo dowolnego zbioru A jest, jako całka, równe polu figury pod wykresem 
funkcji f i nad zbiorem A. Na wspomnianym rysunku, zakreślony obszar odpowiada 
prawdopodobieństwu przedziału (180, 185). 

Zauważmy, że gęstość jest funkcją przyjmującą jedynie wartości nieujemne oraz 
taką, że całka z tej funkcji po całej przestrzeni (pole pod wykresem) jest równa 1. 
Na odwrót, można udowodnić, że każda funkcja spełniająca te dwa warunki jest 
gęstością pewnego rozkładu prawdopodobieństwa. 

W rozdziale 6 omówimy kilka interesujących rozkładów ciągłych — tym miejscu 
ograniczymy się jedynie do najprostszego przypadku. 


4.8 PRZYKŁAD — Rozkład jednostajny 
Niech G C R” będzie zbiorem borelowskim o dodatniej mierze Lebesgue'a, to znaczy 
u(G) > 0. Określmy funkcję: 


1 
H(G)’ 
Jest oczywiste, że f spełnia warunki wymagane od gęstości, jest więc gęstością pew- 
nego rozkładu prawdopodobieństwa. Rozkład ten nazywamy rozkładem jednostaj- 
nym (porównaj ten przykład z definicją 2.10, gdzie określiliśmy prawdopodobieństwo 
geometryczne). 

Jeżeli G = (a,b), to mówimy o rozkładzie jednostajnym na odcinku (a,b). Tak, 
na przykład, wygląda gęstość rozkładu jednostajnego na odcinku (2, 4): 
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Jak już zauważyliśmy poprzednio, w przypadku rozkładów jednowymiarowych, 
znając wykres gęstości rozkładu ciągłego, można łatwo „zobaczyć”, ile wynosi praw- 
dopodobieństwo danego zdarzenia A — jest to mianowicie miara zbioru: 


f(zy)ER"!:zEA, O<y<f(x)). 


Interpretacja ta wskazuje, że prawdopodobieństwo zbiorów jednopunktowych (a więc 
również skończonych i przeliczalnych) w rozkładzie ciągłym wynosi 0. Wynika to 
formalnie w sposób oczywisty z warunku (4.2), gdyż całka liczona po zbiorze miary 
zero równa się 0. 


4.5 Dystrybuanta 


Podstawową pozycję wśród rozkładów zajmują rozkłady jednowymiarowe, czyli mia- 
ry probabilistyczne określone na B(R). Mówiąc: rozkład, będziemy mieć zwykle na 
myśli rozkład jednowymiarowy. 

Okazuje się, że zamiast rozkładów można rozpatrywać pewnego typu funkcje 
zmiennej rzeczywistej o wartościach rzeczywistych, co w wielu przypadkach uprasz- 
cza sytuację. Funkcje te są nazywane dystrybuantami. 


4.9 DEFINICJA — dystrybuanta 
Dystrybuantą nazywamy funkcję F:R — R, spełniającą następujące 
cztery warunki: 


1. F jest funkcją niemalejącą, to znaczy: 
z < y= F(x) < F(y), 
2. F jest prawostronnie ciągła, to znaczy: 


lim F(x) = F(a) 


x—at 


dla każdego a € R, 
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3. imą-;5 F(x) = 1, 
4. lim-o F(x) = 0. 


Związek dystrybuant z rozkładami wyjaśnia następujące: 


4.10 TWIERDZENIE 
Jeżeli P jest rozkładem prawdopodobieństwa, to funkcja F zdefiniowana 
wzorem: 


F(x) = P(-0,z| = P((—0,z]), (4.3) 


jest dystrybuantą. Mówimy wtedy, że rozkład P ma dystrybuantę F, co 
często zaznaczamy pisząc Fp zamiast F. 


Należy podkreślić, że wielu autorów definiuje dystrybuantę zastępując w definicji 
4.9 warunek 2 założeniem, że F jest lewostronnie ciągła w każdym punkcie. Wtedy 
w powyższym twierdzeniu wzór (4.3) ma postać: 


F(x) = P(—œ, z) = P((-0,zx)). 


Oczywiście oba podejścia są jednakowo dobre. 


Zachodzi także twierdzenie odwrotne do twierdzenia 4.10. 


4.11 TWIERDZENIE 
Jeżeli F jest dystrybuantą, to istnieje dokładnie jeden rozkład P, dla 
którego zachodzi wzór (4.3). 


Jest oczywiście ciekawe, w jakich przypadkach dystrybuanta jest ciągła i co to 
oznacza, że jest ona ciągła w danym punkcie. Okazuje się, że nieciągłość ma miej- 
sce dokładnie w punktach, w których rozkład jest „skupiony”, a wielkość „skoku” 
dystrybuanty w danym punkcie zależy od prawdopodobieństwa skupionego w tym 
punkcie. 


4.12 TWIERDZENIE 
Niech P będzie rozkładem prawdopodobieństwa, zaś F — jego dystrybuan- 
tą. Wówczas dla dowolnego a € R: 


F jest ciągła w punkcie a <= P(a) =0. 


Bardziej ogólnie: 
P(a) = F(a) — F(a), 


gdzie F(a) oznacza lewostronną granicę funkcji F w punkcie a (ponie- 
waż F jest niemalejąca, więc granica ta istnieje). 
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Dowód. Weźmy ciąg £n / a (to znaczy, że {£n} jest ciągiem rosnącym, zbież- 
nym do a). Wtedy (—0,a) = U(—œ, £n], a więc (patrz twierdzenie 2.2, warunek 
8): 

F(a) = lim F(zn)= lim P(—œ, zn] =P(-0,a). 


n— oo n— o0 


Stad: 


W przypadku gdy rozkład jest dyskretny lub ciągły, dystrybuanta tego rozkładu 
posiada dość prostą postać. 


4.13 UWAGA 
Niech rozkład dyskretny P będzie zadany przez ciągi {£n} oraz {pn}. Wtedy, ze wzoru 
(4.1), otrzymujemy: 

Fp(a)= J pi. 


iLi [lT 


4.14 UWAGA 
Niech rozkład ciągły P ma gęstość f. Wtedy wprost z definicji 4.7 otrzymujemy: 


ród 1 E FE) dt. (4.4) 


W tym przypadku dystrybuanta jest ciągła we wszystkich punktach. Zauważmy 
natomiast, że jeżeli pewna funkcja mierzalna spełnia wzór (4.4), to jest ona gęstością 
rozkładu, którego dystrybuantą jest F. Jeżeli więc wiemy, że dystrybuanta jest funkcją 
różniczkowalną, ewentualnie poza skończoną liczbą punktów, to jej pochodna jest gęs- 
tością rozważanego rozkładu. Wiadomo ponadto, że w każdym punkcie x, który jest 
punktem ciągłości f, funkcja górnej granicy całkowania, a więc dystrybuanta, jest 
różniczkowalna oraz zachodzi wzór: 


4.15 PRZYKŁAD 
Niech F będzie dystrybuantą rozkładu jednostajnego na odcinku (a,b). Jak łatwo 
się przekonać, korzystając ze wzoru (4.4), otrzymujemy: 


MAPLE 
0, a<a 
F(x) = LA aļxzr<b 
b—a 
1, b<zu 


Można się pytać, czy to, że dystrybuanta rozkładu jest ciągła w każdym punk- 
cie oznacza, że rozkład jest ciągły. Odpowiedź jest jednak negatywna, co można 
stwierdzić, analizując tak zwaną funkcję Cantora. 


Dystrybuantę można także definiować dla rozkładów n-wymiarowych, gdzie 
n > 1. Otrzymuje się wówczas podobne związki między dystrybuantami i rozkła- 
dami, jak dla przypadku jednowymiarowego. Podobne są także wzory na oblicza- 
nie dystrybuant rozkładów dyskretnych i ciągłych. Jednak definicja dystrybuanty 
w wyższym wymiarze nie może być bezpośrednim przeniesieniem definicji 4.9, gdyż 
w definicji tej wykorzystywana jest w sposób istotny struktura porządkowa zbioru 
liczb rzeczywistych. 


4.6 Zmienne i wektory losowe 


Podamy najpierw definicję zmiennej losowej, a następnie znacznie ogólniejszą defi- 
nicję wektora losowego. Niech (Q, X, P) będzie przestrzenią probabilistyczną. 


4.16 DEFINICJA — zmienna losowa 
Funkcję X:0 — R nazywamy zmienną losową, jeżeli jest ona funkcją 
mierzalną względem o-algebry >, to znaczy: 


X-(B)=lweQ: X(vje Bier 
dla każdego zbioru borelowskiego B € B(R). 


4.17 UWAGA 

Zbiory X !(B), gdzie B € B(R), będziemy nazywać zbiorami opisywanymi przez 
zmienną losową X. Podkreślamy wyraźnie, że są to zbiory postaci {w EQ: X(w) € 
B}, co skrótowo będziemy zapisywać {X € B}. Tak więc, na przykład, 


P(X <€) 


oznacza: 


Piw EN: X(w) <ej). 


W definicjach „typu szkolnego” często nie zakłada się mierzalności zmiennej 
losowej — każda funkcja określona na przestrzeni probabilistycznej i przyjmująca 
wartości liczbowe jest nazywana zmienną losową, niemniej rozpatrywane funkcje 
były mierzalne względem o-algebry P(Q), tak więc założenie o mierzalności było 
zbędne. Istotę tego założenia można, mówiąc niezbyt precyzyjnie, częściowo wyja- 
śnić w następujący sposób: założenie mierzalności względem wyróżnionej o-algebry 
odpowiada żądaniu, że zmienna losowa ma opisywać tylko „ciekawe” zdarzenia — 
w szczególności wiemy co oznacza prawdopodobieństwo takich zbiorów. 
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4.7 Rozkład zmiennej losowej 


Każda zmienna losowa indukuje pewien rozkład prawdopodobieństwa w następują- 
cym sensie: 


4.18 DEFINICJA — rozkład zmiennej losowej 
Niech (Q,>,P) będzie przestrzenią probabilistyczną, zaś X:0 — R - 
zmienną losową. Wówczas rozkładem zmiennej X nazywamy rozkład Px, 
zdefiniowany następująco: 


Px(B) = P(X'!(B)) dla BeB(R). 


Zauważmy, że mierzalność X gwarantuje sensowność tej definicji — ponieważ P 
jest określone na zdarzeniach z Z, musimy mieć gwarancję, że X-'!(B) € X. 

Na początki tego rozdziału podaliśmy przykłady kilku zmiennych losowych i po- 
wiedzieliśmy nawet, jaki mogą mieć one rozkład. Nie mówiliśmy wtedy jednak nic 
o przestrzeniach probabilistycznych, na których zmienne te są określone. Jest to ty- 
powa sytuacja — najczęściej nie wskazuje się wyraźnie przestrzeni probabilistycznych, 
a obserwuje się jedynie rozkład zmiennej losowej (i to nam musi wystarczyć). 

Jest więc naturalnym pytanie, czy mając rozkład, powiedzmy Q, można tak 
dobrać przestrzeń probabilistyczną oraz zmienną losową X, określoną na tej prze- 
strzeni, że Px = Q. Mówi o tym bardzo proste, niemniej pożyteczne twierdzenie. 


4.19 TWIERDZENIE 
Niech Q będzie rozkładem prawdopodobieństwa. Wówczas istnieje prze- 
strzeń probabilistyczna (Q, >, P) oraz zmienna losowa X : Q — R taka, 
że: 


Q = Px. 
Dowód. Wystarczy położyć: 
(Q, £, P) = (R, B(R), Q) 


oraz 
X(x)=x dla zER. 


Twierdzenie to jest bardzo wygodne, gdyż rozważając jakikolwiek rozkład, mamy 
gwarancję, że jest on rozkładem pewnej zmiennej losowej, a to pozwala wykorzystać 
w wielu przypadkach język zmiennych losowych w badaniu samych rozkładów. 


4.20 UWAGA 

Okazuje się, że zmienne losowe posiadają wiele pożytecznych własności. Można mia- 
nowicie udowodnić, że suma, iloczyn, kresy górne i dolne, granice górne i dolne, 
granice (o ile istnieją) zmiennych losowych są zmiennymi losowymi. 


r0 


Uogólnieniem zmiennych losowych są wektory losowe. 


4.21 DEFINICJA — wektor losowy 
Funkcję X:0 — R” nazywamy wektorem losowym, jeżeli jest ona funk- 
cją mierzalną względem o-algebry >, to znaczy: 


X (B)=lveQN: X(v)e Biex 
dla każdego zbioru borelowskiego B € B(R”). 


Widzimy, że zmienna losowa jest jednowymiarowym wektorem losowym. Wyróż- 
nianie zmiennych losowych nie ma więc formalnego uzasadnienia, natomiast zrobiono 
to tutaj ze względu na tradycję oraz na szczególne znaczenie wektorów jednowymia- 
rowych — zmiennych losowych. 

Podobnie jak dla zmiennych losowych, określa się rozkład wektora losowego 
X:0 — R” wzorem: 


Px(B) = P(X"!(B)), dla B € B(R”). 


4.8 Niezależność 


Można sprawdzić, że zestawienie (X, Y ) wektorów losowych X i Y określonych na tej 
samej przestrzeni, w szczególności zestawienie zmiennych losowych, jest wektorem 
losowym. Można się więc pytać: czy jest jakiś związek pomiędzy rozkładami tych 
wektorów. W ogólnym przypadku taki związek jest tylko częściowy. Mianowicie, 
wprost z definicji rozkładu wektora losowego mamy: 


Px(A1) = FPrxyy(A1 X R”) Oraz Py (A2) = Pixy) (R” X Av). 


Tak więc znając rozkład zestawienia, znamy również rozkłady „współrzędnych” i bez 
znaczenia jest tutaj przestrzeń probabilistyczna, na której wektory losowe są określo- 
ne. Jednak informacje o przestrzeniach są istotne w problemie przeciwnym: czy zna- 
jąc rozkłady wektorów losowych X i Y, można określić rozkład zestawienia (X,Y). 


4.22 DEFINICJA — niezależność wektorów losowych 
Niech (Q,2,P) będzie przestrzenią probabilistyczną i niech X1,..., Xp 
będą wektorami losowymi określonymi na tej przestrzeni. Mówimy, że 
wektory te są niezależne, jeżeli dla każdego ciągu zbiorów borelowskich 
B;,..., By, zawartych w odpowiednich przestrzeniach, zachodzi: 


P(X € By,..., Xk € By) =P(0X1 € B;)-...: P(X, € BĘ). 


Można więc powiedzieć, że wektory losowe są niezależne, jeżeli opisywa- 
ne przez nie zdarzenia są niezależne (zauważmy, że ża zbiór Bi można 
podstawić całą przestrzeń R”). 


Mówimy, że wektory losowe X1, X2, X3,... są niezależne, jeżeli dla kaž- 
dego naturalnego k, wektory X1,..., Xp są niezależne. 
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4.9 Cwiczenia i zadania 


Ćwiczenie 4.1 Rozpatrujemy eksperyment polegający na rzucie dwiema symetrycz- 
nymi kostkami, a interesuje nas większa spośród liczb oczek uzyskanych na kostkach. 


Wyróżnijmy przestrzeń probabilistyczną (Q, 2, P), gdzie: 


Q={(ij):ij=1,...,6} 


oraz: 


E = o(Aı,..., A6) 


(to znaczy, że © jest najmniejszą o-algebrą zawierającą zbiory Aj,..., An), zaś: 
Ak = {(i, j) : max(i, j) = k} 


(P możemy zdefiniować w dowolny sposób). Określmy następujące trzy funkcje: 


(i, j) = max(i, j), 
Ee 1 gdy i >3lubj>3 
2J) = 0, w przeciwnym wypadku, 


ś3(i, j) =i +j. 


Łatwo sprawdzić, że dwie pierwsze funkcje są zmiennymi losowymi na (Q, 2, P) 
i jest to zgodne z naszą zapowiedzią, że zmienne losowe opisują zdarzenia „cieka- 
we”. Rzeczywiście, zmienna losowa 6, jest po prostu interesującą nas w danej chwili 
wielkością, zaś zmienna ¿> wskazuje na to, czy ta wielkość jest lub nie jest > 3. 
Natomiast funkcja 43 nie jest zmienną losową na tej przestrzeni, gdyż na przykład 
zbiór: 


B = éz ((—00,3]) = t(1, 1), (1,2), (2, 1)} 


nie może być przedstawiony za pomocą zbiorów A;, więc nie jest zdarzeniem (to 
znaczy B ¢ >). Jest to zrozumiałe w tym sensie, że informacja o maksymalnej 
liczbie oczek nie określa jednoznacznie ich sumy. Oczywiście, wszystkie trzy funkcje 
są zmiennymi losowymi względem o-algebry P(Q). 


Ćwiczenie 4.2 Nawiązując do ćwiczenia 4.1, policzymy rozkład zmiennej £> (teraz 
już zakładamy, że P jest miarą określoną jak w schemacie klasycznym). 
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Otrzymujemy: 


P;, (z) = P(£2"(x)) = 0 dla z ¢ {0,1}, 


9 1 

£(0) ( 1 2 3) 36 4 

Oraz 27 3 
P(1) = P(AĄ4U45U46)=—=-. 

(1) ( 4 5 6) 36 4 


Ćwiczenie 4.3 Rozpatrzymy dwie sytuacje, w których zmienne losowe € oraz n ma- 
ją takie same rozkłady, a mimo to ich zestawienia w każdym przypadku mają rozkłady 
istotnie różne. 


W obu poniższych przypadkach zajmujemy się schematem klasycznym. 
Najpierw założymy, że: 


©=1150:308: 
a zmienne losowe są zdefiniowane przez: 
Eli) = nli) = i. 


Oczywiście, rozkłady tych zmiennych są sobie równe i można je w każdej chwili po- 
dać. Ciekawszy dla nas jest natomiast rozkład wektora losowego (£, n). Wprost z de- 
finicji widać, że jest on skupiony w sześciu punktach postaci (i, í), gdzie i =1,...,6. 
Mianowicie: 1 
Pemi) = g. 
Niech teraz: 
=d UT = ler; 


oraz niech zmienne losowe będą określone następująco: 
Eli j) =i, nli, j) = j. 
Oczywiście, tak jak w przypadku poprzednim, zmienne te mają takie same rozkłady. 
Jednak, jak łatwo się przekonać, rozkład ich zestawienia jest całkiem inny. Miano- 
wicie: 1 
Pem (ii) = 36 dla i,j =1,...,6. 
Zauważmy przy okazji, że w drugim przypadku zachodzi równość: 
Pen (1,3) = Peli)P (j) dla wszystkich i, j, 


co oznacza, że rozkład zestawienia jest iloczynem kartezjańskim rozkładów zmien- 
nych składowych. Głębszym powodem tego jest to, że zmienne 6 oraz 7 są niezależne 
— co to oznacza, zostanie za chwilę formalnie zdefiniowane, jednak zakładając (chyba 
całkiem naturalnie), że wynik rzutu jedną kostką nie ma wpływu na wynik rzutu 
drugą kostką, czujemy, że nasze zmienne losowe „powinny” być niezależne. 
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Cwiczenie 4.4 Wykażemy, że podczas rzutu dwiema kostkami suma oczek S i róż- 
nica oczek R nie są zmiennymi losowymi niezależnymi. 


Zauważmy, na przykład, że: 


1 
P(S =12, R= 0) = = 
( i ) 36° 
gdyż powyższe zdarzenie oznacza wypadnięcie pary „szóstek”, natomiast: 
1 6 1 
P(S=12)=-—, P(R=0)=—=- 
(5=12)= zę, P(R=0)=z5=$, 
a więc: 
1 
P(S = 12) - P(R = 0) = —. 
(8 = 12). P(R=0) = z 


Oznacza to, że istnieją zdarzenia zależne opisane przez nasze zmienne losowe, co jest 
sprzeczne z definicją niezależności zmiennych losowych. 


Ćwiczenie 4.5 Niech € będzie zmienną losową o rozkładzie dyskretnym, przyjmują- 
cą wartości: —1, 0, 1, 2, 3, z prawdopodobieństwem i każda. Policzmy rozkład zmien- 
nej losowej £2. 


Zmienna £? przyjmuje wartości: 
0, 1, 4,9 


z prawdopodobieństwami, odpowiednio: 


OI N 
| HH 
| = 


| = 


Ćwiczenie 4.6 Narysujemy dystrybuantę rozkładu jednostajnego na odcinku (0, 2), 
o którym była mowa w przykładzie 4.8. 


MAPLE 


Oto właściwy rysunek: 
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Zadanie 4.1 Niech £ oznacza liczbę orłów uzyskanych podczas rzutu trzema mo- 
netami. Wyznacz rozkład i dystrybuantę £. 


Zadanie 4.2 W urnie jest jedna kula niebieska i dwie kule czarne. Losujemy kolej- 
no: (a) bez zwracania, (b) ze zwracaniem, kule do momentu wylosowania niebieskiej 
kuli. Wyznacz rozkład liczby losowań oraz podaj wartość dystrybuanty tego rozkła- 
du dla liczby 2. 


Zadanie 4.3 Dobrać współczynnik a tak, aby funkcja: 


0 dlaxz £ (0,1) 
f(z) = az(1— x) dlaze (0,1), 


była gęstością pewnego rozkładu prawdopodobieństwa. Znajdź dystrybuantę tego 
rozkładu. 


Zadanie 4.4 Dla jakiej stałej C funkcja P: B(R) — R taka, że: 


C 
P(R) = x(k+D dla KZ ŻE0 7423 


może być funkcją prawdopodobieństwa dla pewnego rozkładu? 


Zadanie 4.5 Dla jakiej liczby C funkcja: 


0 dlaxz<l 
ra=] S dla x > 1, 


jest gęstością pewnego rozkładu prawdopodobieństwa? Dla tak otrzymanej liczby C, 
oblicz P(fz € R: 4 <a)), gdzie a ustalone. 


Zadanie 4.6 Dystrybuanta F zmiennej losowej £ jest dana wzorem: 


0 dlac <—l1 

3 dla -1<z<0 
1(c+1) dla0<z<1l 

1 dlal<z. 


Oblicz P(|e| > a) dla a = 0, 5, 1, 2. 
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Zadanie 4.7 Z przedziału [1, 10] losujemy liczbę naturalną a zgodnie ze schematem 
klasycznym, a następnie z przedziału [1,a] losujemy liczbę £, też według schematu 
klasycznego. Znaleźć rozkład zmiennej losowej £. 


Zadanie 4.8 W urnie jest 5 niebieskich i 3 czarne kule. Niech Tn i Te oznaczają 
numery losowań, w którym po raz pierwszy pojawi się, odpowiednio, niebieska lub 
czarna kula. Znajdź rozkład wektora losowego (Tn, Te). Czy zmienne losowe Tn i Te 
są niezależne? Rozważ dwa przypadki: gdy losujemy po jednej kuli ze zwracaniem 
oraz bez zwracania. 
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Rozdział 5 


Parametry rozkładów 
zmiennych losowych 


5.1 Nadzieja matematyczna 


Często zdarza się, iż albo nie jesteśmy w stanie określić dokładnie rozkładu interesu- 
jącej nas zmiennej losowej, albo nie jest to w ogóle potrzebne. W takich sytuacjach 
częściową informację o zachowaniu się zmiennej losowej można odczytać z pewnych 
parametrów liczbowych rozkładu tej zmiennej. Omówimy poniżej tylko najważniej- 
sze parametry charakteryzujące rozkład zmiennej losowej: wartość oczekiwaną, wa- 
riancję, odchylenie standardowe oraz kwantyle. Podkreślamy jednak, że są używane 
(zwłaszcza w statystyce) także inne charakterystyki liczbowe rozkładów zmiennych 
losowych. 

Nadzieja matematyczna, zwana również wartością średnią lub wartością oczeki- 
waną, jest podstawowym parametrem każdego rozkładu. Z pojęciem tym spotykamy 
się w wielu codziennych sytuacjach, chociaż nie zawsze zdajemy sobie z tego sprawę. 
Zaczniemy od prostego, choć niezbyt naturalnego, przykładu, a następnie podamy 
definicje w przypadku rozkładów dyskretnych i ciągłych. 


51 PRZYKŁAD 
Pan Kowalski proponuje następującą grę: za prawo jednego rzutu kostką syme- 
tryczną Kowalski pobiera opłatę w wysokości 4 zł, natomiast wypłaca po każdym 
rzucie kwotę a zł, gdzie a jest liczbą uzyskanych oczek, o ile liczba ta jest większa 
niż 1; w przypadku wypadnięcia „jedynki” gracz ma dodatkowy bezpłatny rzut, po 
którym otrzymuje kwotę równą (w złotych) liczbie uzyskanych oczek. Czy gra jest 
opłacalna dla Kowalskiego? 
Zauważmy od razu, że jeżeli gra kończy się po jednym lub nawet po kilku rzutach, 
to odpowiedź może być rzeczywiście różna. Na przykład, w pięciu rzutach mogą 
wypaść następujące wyniki: 


2 » 2 33 „3 z » » 
„9 2 „4 2 „9 2 „l 1w powtórce „6 2 „6 ó 


T7 


Wtedy Kowalski pobiera 5-4 zł = 20 zł, natomiast musi wypłacić 26 zł. Jednak 
mogą równie dobrze wypaść następujące wyniki: 


25 24 „A”, „e 4005 
co oznacza dla Kowalskiego zarobek 3 zł (= 20 zł —17 zł). 


MAPLE 


Z kolei, gdy gra będzie prowadzona dość długo — powiedzmy, że Kowalski znaj- 
dzie kandydatów na 360 prób — wtedy sytuacja będzie wyglądać inaczej, gdyż przy 
wielokrotnym powtarzaniu gry można się spodziewać pewnych prawidłowości. Ko- 
walski zakłada mianowicie, że przy 360 rzutach każda ścianka wypadnie około 60 
razy, będzie więc musiał zapłacić za około 60 „dwójek”, 60 „trójek” i tak dalej, 
a także za dodatkowe rzuty (po wypadnięciu „jedynki”), czyli za około 10 „jedy- 
nek”, 10 „dwójek”, czy wreszcie 10 „szóstek”. Tak więc w sumie Kowalski zapłaci 
około: 

10-:1+70:2+...+70-6=10+ 70:20 = 1410 (zł), 


natomiast zbierze opłaty w wysokości: 
360 -4 zł = 1440 zł. 


Ma więc szansę niewielkiego zarobku, czyli po prostu gra jest opłacalna (jeżeli nie 
liczymy kosztów własnych). 

Można się teraz pytać, czy gra jest opłacalna przy innej liczbie prób, na przy- 
kład 200 lub 1000. Zamiast za każdym razem powtarzać powyższy rachunek, można 
policzyć jeden raz wielkość m: 


a następnie pomnożyć ją przez zakładaną liczbę prób. Mamy wówczas, na przykład: 
360m = 1410, 


czego należało się oczywiście spodziewać, gdyż ostatnia równość powstała z poprzed- 
niej przez podzielenie obu stron przez 360. 


Zauważmy teraz, że w powyższym zadaniu możemy wyróżnić w sposób naturalny 
zmienną losową X, zdefiniowaną jako wypłata po każdej grze. Przyjmuje ona sześć 


wartości: 
z1=1, £2 = 2, eeg zę=6 
z prawdopodobieństwami: 
La L zab 
Pi = 36 P2 = 36 , P6 = zg 


Zauważmy, że średnia wypłata m jest wtedy równa: 
m = p111 + poto + p3t3 + p4T4 + p5T5 + p6z6. 


Wielkość ta nazywana jest właśnie wartością średnią, wartością oczekiwaną, lub 
nadzieją matematyczną zmiennej losowej X. Mówiąc językiem potocznym, jest ono 
równa sumie wszystkich możliwych wartości x; zmiennej X, wymnożonych przez 
odpowiednie wagi p;. 

Nie jest zatem niespodzianką następująca definicja: 


5.2 DEFINICJA -— nadzieja matematyczna 
1. Niech (Q,X,P) będzie przestrzenią  probabilistyczną, zaś 
X: Q — R - zmienną losową o rozkładzie dyskretnym: 


P(X = qti) = pi, i=1,..., N, N< œ. 


Nadzieją matematyczną (wartością oczekiwaną, wartością średnią) 
nazywamy liczbę: 


N 
m = E(X) = EX = X` zipi. 
1=1 


2. Niech (Q0,>,P) będzie przestrzenią  probabilistyczną, zaś 
X:0 — R - zmienną losową o rozkładzie ciągłym z gęstością f. 
Nadzieją matematyczną (wartością oczekiwaną, wartością średnią) 
nazywamy liczbę: 


OO 
m = E(X) = EX 1 xf(x)dz. 
OO 
5.3 UWAGA 
W przypadku dyskretnym, gdy zmienna losowa X przyjmuje nieskończenie wiele war- 
tości, szereg określający wartość oczekiwaną może być zbieżny lub nie. W tym drugim 
przypadku wartość oczekiwana nie istnieje. 


5.4 UWAGA 

Definicja wartości oczekiwanej w przypadku ciągłym może wydać się niezbyt oczywi- 
sta. Zauważmy jednak, że jest ona naturalną konsekwencją definicji całki oznaczonej. 
Mianowicie, całkę oznaczoną z danej funkcji ciągłej h po przedziale o końcach a ib 
można dowolnie przybliżać sumą: 


T h(y) dy m e h(z;)(yi — Yi-1), 
a i=1 
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gdzie y; są punktami podziału przedziału (a,b), to znaczy a= yo < ... < Yn = b, 
zaś liczby xi € [yi-1, yi] sq dowolne. Weźmy jako funkcję h iloczyn: h(y) = yf(y). 
Wtedy: 


b n n 
J yf(v) dy ~ X` zif (xi) (yi — yi-1) = D tipi, 
a i=1 i=1 


gdzie pi = f(xi)(yi—yi-1). Powyższy wzór można interpretować następująco: zmien- 
ną losową o rozkładzie ciągłym o gęstości f można przybliżać zmiennymi losowymi o 
rozkładach dyskretnych — wartość oczekiwana X będzie więc przybliżana wartościami 
oczekiwanymi tych dyskretnych zmiennych losowych. 


55 PRZYKŁAD 
Obliczymy wartość oczekiwaną zmiennej losowej o rozkładzie dwupunktowym: P(X = 
0)=1-p, P(X =1) =p. 


MAPLE 


Otrzymujemy: 


E(X) = 0(1 — p) + 1p = p. 


5.6 PRZYKŁAD 
Obliczymy wartość oczekiwaną zmiennej losowej o rozkładzie jednostajnym na prze- 
dziale o końcach a i b. 


MAPLE 


Otrzymujemy: 
© Sax 1 f a+b 
E(X) = pa sjdr= | a dr=;— | sdz= 3 
(X) A fa) a b-a ba Ja 2 
Wynik ten wydaje się intuicyjnie jasny: wartość oczekiwana jest środkiem przedziału, 
na którym skupiony jest rozkład jednostajny. 


5.2  Wariancja i odchylenie standardowe 


Innym bardzo ważnym parametrem rozkładu zmiennej losowej jest wariancja i Ściśle 
z nią związane odchylenie standardowe. 
5.7 DEFINICJA — wariancja i odchylenie standardowe. 
Niech (Q, £, P) będzie przestrzenią probabilistyczną, zaś 
X:Q — R - zmienną losową, posiadającą skończoną wartość oczeki- 
waną m = E(X). Wariancją zmiennej losowej X nazywamy liczbę: 


o*=D'(X)=D*X=E((X — m)”), 


natomiast liczbę: 


o= 2(X) = VD? X 


nazywamy odchyleniem standardowym zmiennej X. 
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Interpretacja wariancji jest następująca. Zmienna losowa X —m jest odchyleniem 
zmiennej losowej X od swojej wartości oczekiwanej, zaś jeżeli nie interesuje nas znak 
tego odchylenia, tylko jego wielkość bezwzględna, możemy rozważać zmienną losową 
|X — m|. Tak więc liczba E(|X — m|) jest oczekiwanym odchyleniem — wielkość ta 
jest nazywana średnim błędem — jednak z pewnych względów jest ona niewygodna 
w obliczeniach. Dlatego, zamiast średniego błędu, rozważa się wielkość, która jest wy- 
godniejsza w obliczeniach, a ma podobne własności co średni błąd — jej duża wartość 
wskazuje na duży rozrzut zmiennej X. Taką wielkością jest właśnie wariancja, a więc 
także odchylenie standardowe. Co więcej, w wielu typowych sytuacjach, odchylenie 
standardowe nie różni się wiele od średniego błędu. Zauważmy, że w skrajnym przy- 
padku, gdy zmienna losowa jest stałą, powiedzmy X = a, czyli gdy P(X =a)=l, 


~ 


to E(X) = a, a więc oczekiwany błąd, wariancja i odchylenie standardowe są równe 


Zeru. 
5.8 UWAGA 
W przypadku zmiennej losowej o rozkładzie dyskretnym wariancję obliczamy ze wzo- 
ru: R 
*(X) = X (zi z m)’pi 
i=1 
5.9 UWAGA 


W przypadku zmiennej losowej o rozkładzie ciągłym wariancję obliczamy że wzoru: 


5.10 PRZYKŁAD 
Obliczymy wariancję zmiennej losowej o rozkładzie dwupunktowym: P(X = 0) = 
1-p, P(X=1) =p. 


MAPLE 


Wiemy już, E(X) = p. Mamy więc: 


*(X) =(0-p)' - p) + (1 — p)” p=Pp(l — p). 


511 PRZYKŁAD 
Obliczymy wariancję zmiennej losowej o rozkładzie jednostajnym na przedziale o koń- 
cach a i b. 


MAPLE 


Wiemy już, żem = E(X) = ate, Mamy więc: 


x)= f (6-m?f()dr= Ik (2-2) a= e, 
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5.12 PRZYKŁAD -— kontynuacja przykładu 5.1 
Wariancja zmiennej losowej X wynosi: 


2(X) ~ 2.188, 


zaś odchylenie standardowe: 
o = 1.419. 


Wartość oczekiwana, wariancja i odchylenie standardowe mają pewne własno- 
ści, które znakomicie ułatwiają niektóre obliczenia, a co więcej, pokazują ich ważne 
interpretacje. 


5.13 TWIERDZENIE 
Niech X oraz Y będą zmiennymi losowymi, określonymi na tej samej 
przestrzeni probabilistycznej Q. Załóżmy, że istnieją nadzieje matema- 
tyczne E(X) i E(Y). Wtedy: 


1. jeżeli X = const = c, to E(X) =c, 

2. jeżeli X > 0, to E(X) > 0, 

3. E(aX) = aE(X) dla każdej liczby a € R, 
4 (X) +E(Y), 

5. E(X - Y}? < E(X?) - E(YŻ), 
6 
7 
6 


*(X) = E(X?) - E(X)’, 
2 (aX) = a? D?(X) dla każdej liczby a € R, 
. X = const = c 4> D?(X) =0. 


Jako szczególny wniosek otrzymamy następujące ważne twierdzenie: 


5.14 TWIERDZENIE 
Niech X1, X2,..., Xn będą zmiennymi losowymi o takiej samej nadziei 
matematycznej m. Oznaczmy: 


Sn =X1+X2+... + Xn. 


Wtedy: 


1. E(Sn) = nm, 


D: E (>) =m. 
n 


Gdy zmienne losowe są niezależne, wartości oczekiwane i wariancje posiadają 
pewne dodatkowe własności. 


5.15 TWIERDZENIE 
Niech X i Y będą dwiema zmiennymi losowymi niezależnymi, określony- 
mi na przestrzeni probabilistycznej (Q, 2, P). 
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1. Jeżeli E(|X|) < oo i E(|Y|) < œ, to istnieje nadzieja matematycz- 
na iloczynu zmiennych losowych X -Y oraz: 


E(X -Y) = E(X) -E(Y). 


2. Jeżeli D?(X) < œ i D?(Y) < w, to: 


(X +Y) =D*(X) + D*(Y). 
Zauważmy, że natychmiastowym wnioskiem z powyższego twierdzenia jest na- 
stępujące: 


5.16 TWIERDZENIE 
Niech X1, Xo,..., Xn będą niezależnymi zmiennymi losowymi o tym sa- 
mym rozkładzie. Oznaczmy jak poprzednio: 


Sn = Xi +X2+... + Xn. 


Wówczas jeżeli o? = D?(X;) < œ, to: 


1. (Sn) =no?,  olSn) = oyn. 
Eon 


Można zatem powiedzieć, że odchylenie standardowe sumy niezależnych 
składników wzrasta tak jak yn, zaś odchylenie średniej arytmetycznej 
tychże składników maleje tak jak Ta 


5.17 TWIERDZENIE — Reguła 3-0 
Niech X będzie zmienną losową o wartości oczekiwanej m i odchyleniu 
standardowym o. Wtedy: 


1 
P(X — m| > 30) < z: 


5.3  Kwantyle 


Dla każdej dystrybuanty F, a więc też dla każdej zmiennej losowej, określa się tak 
zwany kwantyl rzędu p, gdzie 0 < p < 1. Jest to liczba: 


qp = min{z : F(x) > p}. 


W przypadku gdy dystrybuanta jest funkcją odwracalną, określenie kwantyla 
znacznie się upraszcza: 


dp = F(p). 


Wówczas kwantyl ma prostą interpretację w języku zmiennych losowych. Mianowicie: 
P(X < qp) = P(X < p) = F(qp) =p, 
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P(X>q)=1-P(X<qg)=1-F(qg)=1—p. 


Jednak nawet w tym przypadku obliczanie kwantyli może być trudne, gdyż nie zna- 
my jawnych wzorów na funkcje odwrotne do dystrybuant wielu ważnych rozkładów. 
Niemniej, dla szeregu podstawowych rozkładów opracowano tablice, z których moż- 
na odczytać kwantyle qp dla często używanych wartości p. Pamiętajmy jednak, iż 
dużo prościej jest skorzystać z dowolnego programu komputerowego z modułem sta- 
tystycznym — w szczególności za pomocą programu Excel można uzyskać kwantyle 
rozkładu normalnego oraz rozkładów używanych do wnioskowań statystycznych. 
W przypadku rozkładu dyskretnego, wyznaczenie kwantyla rzędu p trzeba bez- 
pośrednio oprzeć na jego definicji. Załóżmy, dla ustalenia uwagi, że zmienna losowa 
o rozkładzie dyskretnym przyjmuje następujące wartości (ustawione w ciąg rosnący): 


£1 < To < T3 X... < En, gdzie n < œ. 
Wtedy qp jest tym jedynym elementem z;,, dla którego zachodzi warunek: 
F (£io-1) < p S F (Tio), (5.1) 
przy czym przyjmujemy, że F (xo) = 0. 
Kwantyl rzędu z nazywa się medianą. 


5.18 PRZYKŁAD 
Obliczymy kwantyl rzędu 0.95 rozkładu jednostajnego skupionego na przedziale 
(—1,1). 

Na podstawie przykładu 4.15, dystrybuanta tego rozkładu wyraża się wzorem: 


0, z<—l 
F(z) = sa 1<r<1 
5 EEG 
Zatem dla 0 < p < 1 mamy: 


i stąd z = 2p — 1. Czyli qp = 2p — 1, a więc: 
d0.95 = 0.9. 


5.19 PRZYKŁAD 
Obliczymy medianę rozkładu zmiennej losowej T, przyjmującej wartości 1,2,3,... 


z prawdopodobieństwami py, po, p3,..., określonymi jako: 
BYFZT 
,=P(T=i)=|- =. 
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Na podstawie ćwiczenia 2.5, T można interpretować jako liczbę rzutów syme- 
tryczną kostką, do momentu uzyskania „szóstki”. 

Będziemy tak długo obliczać wartość dystrybuanty w kolejnych punktach, aż 
znajdziemy punkt określony równaniem (5.1). Zauważmy, że następna wartość dys- 
trybuanty zależy od wartości poprzedniej: 


F(i) = F(i — 1) + pi. 


MAPLE 


Tak więc otrzymujemy kolejno: 
0.16667, 0.30556, 0.42130, 0.51775, 


czyli mediana wynosi 4. Inaczej mówiąc, prawdopodobieństwo tego, że „szóstka” 
pojawi się po raz pierwszy nie później niż w czwartym rzucie, jest nie mniejsze niż 
1 


2: 


5.4 Cwiczenia i zadania 


Ćwiczenie 5.1 Jakie są nadzieja matematyczna i wariancja sumy oczek przy rzucie 
parą kostek do gry? 


Niech X oznacza sumę oczek uzyskanych na obu kostkach. Mamy obliczyć war- 
tość oczekiwaną E(X) oraz wariancję D?(X). 

Sposób pierwszy (na siłę). Można wyznaczyć rozkład zmiennej losowej X i sko- 
rzystać ze wzorów określający nadzieję matematyczną i wariancję. Oczywiście, X 
przyjmuje wartości 


Duż. 80; 
kolejno z prawdopodobieństwami: 


1 2 3 4 5 6 5 4 3 2 1 
36 36° 36° 36 36 36 36 36 36 36° 36` 


Mamy więc: 
1 2 1 
= E(X) = 2. — -= +... +12. — = 
m= E(X) 3613 a T 7. 
1 2 1 35 
ERA EA a 43 TR N 


Sposób drugi. X jest sumą dwóch zmiennych losowych: 


X = Xı + M2, 
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oznaczających liczby oczek na poszczególnych kostkach. Mają one więc ten sam roz- 


kład skupiony w punktach 1,...,6 z jednakowym prawdopodobieństwem ż. Zatem: 
1 1 1 21 
E(X) =E(X2)=1- 2:-+:+6:-= = 3.5, 
(X1) (X2) gT 6 + 6 6 


a więc korzystając z tego, że suma zmiennych losowych ma nadzieję matematyczną 
równą sumie nadziei składników (patrz twierdzenie 5.13), mamy: 


E(X) = 3.5+3.5= 7. 


Wariancja X1, a więc także X3, jest również łatwiejsza do obliczenia niż w poprzed- 
nim sposobie: 


1 2 1 /2a\? 
2(X1) = E(X?) — a(x) =a E (p) 


6 
_91 (3) -5 
6 67 12 


Tak więc, korzystając z twierdzenia 5.13: 


(X) = 2-5 = > 


Drugi z powyższych sposobów jest dość uniwersalny. Na przykład, możemy po- 
dobnie obliczyć średnią i wariancję sumy oczek otrzymanych przy wielokrotnym 
rzucie kostką. Za chwilę poznamy także bardziej interesujące zastosowania. 


Ćwiczenie 5.2 Niech X oznacza liczbę sukcesów w schemacie Bernoulliego. Obli- 
czymy nadzieję matematyczną i wariancję X. 


Niech X; oznacza liczbę sukcesów w i-tym doświadczeniu (i = 1,...,n). Zmienne 
Xi mają taki sam rozkład dwupunktowy i są oczywiście niezależne. Co więcej, obli- 
czyliśmy już nadzieję matematyczną i wariancję takich zmiennych (patrz przykłady 
5.5 i 5.10). 


MAPLE 


Mamy więc (dlaczego?): 


E(X) = np, *(X) = np(1 — p). 
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Ćwiczenie 5.3 W celu zbadania dużej populacji osób, podzielono ją na grupy, a na- 
stępnie pobrano od każdej osoby krew oraz przeprowadzano analizę łączną dla po- 
szczególnych grup, wykonując odpowiedni test na próbkach powstałych przez zmie- 
szanie krwi osób należących do tej samej grupy. Gdy w pewnej grupie wykryto wirus 
chorobowy, przeprowadzano odrębną analizę dla każdej osoby z tej grupy. Załóżmy, że 
liczebność populacji wynosi N, liczność grup wynosi n, zaś k niech będzie liczbą grup 
(oczywiście N = nk). Zakładamy też, że prawdopodobieństwo tego, że dany człowiek 
jest zarażony interesującym nas wirusem wynosi p oraz że obecność wirusa u danej 
osoby jest niezależna od jego obecności u innych osób (jest to istotnie upraszczające 
założenie). Naszym zdaniem jest tak dobrać wielkość grupy n, aby liczba wszystkich 
(bardzo kosztownych) analiz była, w pewnym sensie, minimalna. 


Obliczymy najpierw nadzieję matematyczną liczby wszystkich analiz. Na pierw- 
szy rzut oka wydaje się to dość trudnym zadaniem, gdyż nie jest łatwo wyznaczyć 
rozkład tej zmiennej losowej. Wykorzystamy jednak tutaj twierdzenie, że nadzieja 
matematyczna sumy zmiennych losowych jest równa sumie nadziei matematycznych 
poszczególnych składników. Niech X; będzie liczbą analiz przeprowadzonych w i-tej 
grupie (i = 1,..., k). Liczba wszystkich analiz X jest więc równa: 


RER ŻE: 


a stąd: 


E(X) = E(X1) +... + E(X). 


Zauważmy także, że wszystkie zmienne losowe X; mają taki sam rozkład — policzmy 
więc nadzieję matematyczną jednej z nich, na przykład X,. Zauważmy, że zmienna 
ta przyjmuje dwie wartości: 

lin+l, 


z prawdopodobieństwami odpowiednio: 
(1-p)” (nie wykryto wirusa w grupie) 


oraz 
1— (1 — p)” (przynajmniej u jednej osoby jest wirus). 


W takim razie: 


(X) = 1-(1-p)" +(n+1):(1-(1—p)”), 


a zatem: 


MAPLE 
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Wyraziliśmy więc E(X) jako funkcję zmiennej n, zaś interesuje nas znalezienie 
wartości najmniejszej tej funkcji. Ze względu na dużą złożoność powyższego wzoru, 
jest to zadanie analitycznie trudne. Z drugiej strony, znając konkretne wartości N 
oraz p możemy to zadanie rozwiązać graficznie. Narysujmy, przykładowo, wykres 
E(X) dla N = 1000 i p = Ti: w zależności od n = 1,...,500: 


1000 4 


Zmniejszając zakres n do przedziału [1,30] widzimy, że wartość minimalna zostaje 
osiągnięta, gdy wielkość grupy jest równa 10. 


1000 4 


Dla tej wartości n zmienna losowa X; ma rozkład skupiony w punktach 1 oraz 11 
z prawdopodobieństwami 0.991 = 0.9043820750 i 1 — 0.991? z 1 — 0.9043820750 ~ 
0.0956179250. Tak więc: 


E(X) ~ 1.956179250, 


a zatem: 


E(X) ~ 195.6179250. 


Tak więc średnio będzie potrzebne niecałe 200 analiz. Oczywiście, liczba analiz może 
być istotnie większa, niemniej, stosując regułę 3-0, możemy znaleźć górne „bezpiecz- 
ne” ograniczenie na liczbę analiz. Rzeczywiście, z nierówności Czebyszewa wiemy, 
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że 
8 
P(X <m+30) > P(X — m| < 30) > g’ 
zatem wystarczy obliczyć odchylenie standardowe o zmiennej losowej X. Ponieważ 
jednak X jest sumą niezależnych zmiennych losowych X; o tym samym rozkładzie, 


to: 


*(X) = kD*(X1). 


W naszym przypadku n = 10 i k = 100, a więc 


2(X1) ~ 1° -0.9043820750 + 11? - 0.0956179250 — 1.956179250* ~ 8.647513741. 


Teraz: 


o = +/D?(X) ~ v100 - 8.647513741 = 29.40665527. 


Można więc stwierdzić, że z prawdopodobieństwem co najmniej 5, liczba analiz 
będzie nie większa niż: 


195.6179250 + 3 : 29.40665527 < 284. 


Ćwiczenie 5.4 Przypuśćmy, że uczestnik gry rzuca kolejno monetą symetryczną 
aż do momentu, kiedy uzyska pierwszego orła. W momencie tym gra się kończy, 
a uczestnik otrzymuje 2* złotych, gdzie k jest liczbą wszystkich rzutów, jakie wykonał. 
Interesuje nas oczekiwana wygrana (jest to istotne pytanie, bo jeżeli ta wygrana 
wynosiłaby — powiedzmy — m, to pobierając właśnie m złotych za prawo uczest- 
nictwa w grze, mielibyśmy grę sprawiedliwą w tym sensie, że przy wielokrotnym jej 
powtarzaniu średni zysk, a zatem i średnia strata, wynosi 0). 


Niech W będzie wygraną gracza — przyjmuje ona wartości: 


2,4,8,2., 
z prawdopodobieństwami: 
1 1 1 
PPE 
Tak więc: 
E(W) = 3 oba ag 
k=1 2 


Zauważmy jednak, że mediana W wynosi 2. 


Ćwiczenie 5.5 Bardzo często musimy wyznaczyć kwantyl rozkładu, o którym mamy 
tylko częściowe, stablicowane wiadomości. Na przykład, wyznaczymy kwantyl rzędu 
0.975 w rozkładzie normalnym o dystrybuancie ©, stablicowanym w module 5. Mamy 
także informację, że rozkład ten ma gęstość, która jest funkcją parzystą. 
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Znajdujemy wewnątrz tablicy wartość p, a następnie z jej obrzeży odczytujemy 
kwantyl qp. W tym przypadku 40.975 = 1.96. 

Zauważmy, że z tablicy tej możemy bezpośrednio odczytywać jedynie kwan- 
tyle rzędów nie mniejszych niż 0.5. Jednak z parzystości funkcji gęstości od ra- 
zu widać (naszkicuj wykres gęstości i pamiętaj, że dystrybuantę interpretuje się 
jako pole pod wykresem; alternatywnie, skorzystaj ze zmiany zmiennych w całce 
P(x) = [*”, f(s) ds), że dla każdego z € R: 


$(-z)=1— Ś(z). 
Zatem dla p < 0.5 mamy: 
P(g) =p > 1-9%(-9)5p = $(-9)=1-p 


i z określenia kwantyla otrzymujemy: 


d1-p = —dp: 


Na przykład: 
do.025 = —4q0.975 = —1.96. 


Ostrzeżenie. Niektóre (bardziej tradycyjne) tablice i pakiety komputerowe (wśród 
nich, oczywiście, Excel), „ułatwiają” użytkownikowi życie i jako kwantyl rzędu p 
podają inną wielkość, na przykład $7'(1 — 5)!!! 


Zadanie 5.1 Włamywacz ma n kluczy, z których dokładnie jeden jest kluczem 
właściwym. Wybiera on klucze losowo i nie pamięta, które z nich były już próbowa- 
ne. Oblicz średnią ilość prób potrzebną do otwarcia drzwi. 


Zadanie 5.2 Z urny zawierającej 5 kul niebieskich, 4 kule czarne i 3 kule czer- 
wone losujemy po parze kul, potem zwracamy je z powrotem do urny, a następnie 
powtarzamy losowanie i tak dalej. Jaka jest wartość średnia czasu oczekiwania na 
pojawienie się pary kul tego samego koloru, gdy przy wyborze pary losujemy kule: 
(a) ze zwracaniem, (b) bez zwracania? 


Zadanie 5.3 Jaką opłatę powinien pobierać pan Kowalski z przykładu 5.1, gdyby 
pozwalał wielokrotnie powtarzać rzut (nie tylko jeden raz) po wypadnięciu „jedyn- 
ki”? 


Zadanie 5.4 Pewien człowiek jeździ do pracy autobusem, a następnie tramwajem, 
przy czym może korzystać z dwóch linii tramwajowych: A lub B. Wiadomo ponadto, 
że autobus jeździ średnio co 15 minut, tramwaje linii A — co 10 minut, a tramwaje 
linii B — co 20 minut oraz, że jeżdżą one niezależnie od siebie. Średnio jak wiele czasu 
spędza ten człowiek na przystankach? 
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Zadanie 5.5 Dwiema symetrycznymi kostkami sześciennymi rzucono n razy. Ob- 
licz nadzieję matematyczną i wariancję ilości rzutów, w których wypadła ta sama 
liczba oczek. 


Zadanie 5.6 W ilu rzutach kostką do gry należy spodziewać się pojawienia wszyst- 
kich sześciu ścianek? 


Zadanie 5.7 Jaka jest oczekiwana objętość graniastosłupa, jeżeli długości jego kra- 
wędzi są liczbami wylosowanymi z odcinka (0, 1), zgodnie z rozkładem jednostajnym? 
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Rozdział 6 


Przegląd ważniejszych 
rozkładów 


W poprzednich rozdziałach „uprawialiśmy” dość ogólną teorię rachunku prawdopo- 
dobieństwa, dlatego teraz zajmiemy się aspektem bardziej praktycznym i omówimy 
kilka podstawowych rozkładów oraz wskażemy na niektóre typowe sytuacje, w któ- 
rych rozkłady te występują. Pragniemy jednak podkreślić, iż rozważane tutaj roz- 
kłady nie wyczerpują wszystkich ważnych, występujących w literaturze przedmiotu 
rozkładów prawdopodobieństwa. 


6.1 Rozkłady związane ze zliczaniem 
e Ile eksperymentów zakończy się sukcesem? 


e Ile jest zdarzeń sprzyjających wylosowaniu „naszych” numerów w grze liczbo- 
wej? 


e Ile zgłoszeń napływa średnio w ciągu godziny do pogotowia ratunkowego w go- 
dzinach nocnych? 


e Ile wypadków śmiertelnych ma miejsce podczas kąpieli w morzu? 
Aby umieć odpowiadać na te i podobne pytania, najpierw należy zawsze zdać 


sobie sprawę z natury rozważanego zjawiska, czyli, mówiąc bardziej precyzyjnie, 
z charakteru rozkładu prawdopodobieństwa odpowiadającego danej sytuacji. Oka- 
zuje się, że wiele zupełnie różnych od siebie zjawisk zachodzi według podobnych 
schematów — na przykład jest w istocie losowaniem bez zwracania lub ze zwraca- 
niem. Omówimy teraz kolejno kilka podstawowych rozkładów, odpowiedzialnych za 
większość tego typu sytuacji. 

Na początku powtórzymy poznaną już wcześniej (patrz przykład 4.6) definicję 
rozkładu dwumianowego. 
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6.1.1 Rozkład dwumianowy 


Rozkład P nazywamy rozkładem dwumianowym, jeżeli istnieją liczby n > 0 oraz p 
i q takie, że 0 < p,q < 1, p+ q = 1 oraz zachodzi równość: 


P(k) = (r) płq” * dlak=0,1,...,n. 


MAPLE 


Następujący wykres przedstawia rozkład dwumianowy z parametrami n = 12 
ip=0.6: 


0.24 


Wzór dwumienny Newtona pozwala stwierdzić, że > ;_, P(k) = 1, a więc po- 
wyższa równość rzeczywiście określa rozkład P w sposób jednoznaczny (jest to oczy- 
wiście rozkład dyskretny). Poprzednio mieliśmy już okazję poznać różne sytuacje, 
w których on występuje — następujące twierdzenie formalizuje nasze dotychczasowe 
rozważania: 


6.1 TWIERDZENIE 
Niech X1,..., Xn będą niezależnymi zmiennymi losowymi o takim samym 
rozkładzie dwupunktowym. Wtedy suma: 


Sn = Xi +... + Xn 
ma rozkład dwumianowy. 


Dowód. Zdarzenie £5, = k} jest sumą rozłącznych zdarzeń polegających na 
tym, że dokładnie k spośród zmiennych losowych X,,..., X, przyjmuje wartość 
1, a więc pozostałe n — k zmiennych przyjmuje wartość 0. Niech 4;,,..,, będzie 
jednym z takich zdarzeń, gdzie t1,...,ię oznaczają numery tych zmiennych, które 
przyjmują wartość 1. Z kolei każde zdarzenie 4;, ... ;, jest iloczynem n zdarzeń postaci 
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1X; = £j}, gdzie e; = 1 lub e; = 0, a prawdopodobieństwa tych zdarzeń są równe 
odpowiednio p i q. Z niezależności zmiennych X,,..., Xn wynika, że: 


P( Aii) = pe. 


: f DSC i x > n 7 $ 
Ponieważ wskaźniki iy,...,ży można wybrać na k sposobów, więc: 


P(A)= P U Arsi |= ŻĘ Pigs) 


ay tk il,- tk 


= k n-k _ |P \ „k n-k 
= X p'q - (p) - 


il, tk 


6.2 PRZYKŁAD -— Losowanie że zwracaniem 

Przypuśćmy, że pewna populacja składa się z N elementów. Niech p będzie prawdo- 
podobieństwem tego, że dany element z tej populacji ma pewną własność, powiedzmy 
własność W. Losujemy ze zwracaniem n elementów i oznaczamy przez X liczbę tych 
spośród nich, które mają własność W. Widać, że zmienna losowa X ma rozkład 
dwumianowy. 


Przypomnimy teraz wyprowadzone w ćwiczeniu 5.2 wzory na nadzieję matema- 
tyczną i wariancję zmiennej losowej o rozkładzie dwumianowym. Wyrażają się one 
następującymi wzorami: 


E(X) = np, *(X) = npq. 


6.1.2 Rozkład Poissona 
Rozkład P jest rozkładem Poissona, jeżeli istnieje taka liczba A > 0, że: 


k 


Pk) = ef dla k=0,1,2,... 


MAPLE 


Poniższy wykres przedstawia rozkład Poissona o parametrze A = 5. 
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Okazuje się, że wiele zjawisk podlega właśnie rozkładowi Poissona. Kolejne twier- 
dzenie mówi o tym, że jest on w pewnym sensie granicą rozkładów dwumianowych. 
W szczególności, gdy mamy do czynienia z dużą (n > 100) liczbą niezależnych prób 
Bernoulliego, z jednakowym, małym (p < 0.1) prawdopodobieństwem sukcesu każ- 
da, to liczba sukcesów ma niemal dokładnie rozkład Poissona z parametrem A = np. 
Zgodność taka została zaobserwowana w wielu konkretnych sytuacjach praktycz- 
nych. Co więcej, istnieją dość dokładne oszacowania błędu, jaki popełniamy przy- 
bliżając rozkład dwumianowy rozkładem Poissona. W tym miejscu poprzestaniemy 
jedynie na wykazaniu prostego twierdzenia wskazującego na możliwość takiego przy- 
bliżania oraz na podaniu danych liczbowych ilustrujących jego dokładność. 


6.3 TWIERDZENIE 
Niech liczby pn > 0 tworzą taki ciąg, że: 


lim npp=A>0 
noo 
oraz niech k będzie nieujemną liczbą naturalną. Wtedy: 


k 
N n k n=k _ —A A 
„im, e Pall = Pn) =€" gr: 


MAPLE 


Następna tabela porównuje rozkład dwumianowy rozkładem Poissona. 
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n = 100, p=0,01 n = 50, p=0,1 n = 100, p=0,1 
rozkład rozkład rozkład rozkład rozkład rozkład 
k dwum. Poissona dwum. Poissona dwum. Poissona 
0 0,3660 0,3679 0,0052 0,0067 0,0000 0,0000 
1 0,3697 0,3679 0,0286 0,0337 0,0003 0,0005 
2 0,1849 0,1839 0,0779 0,0842 0,0016 0,0023 
3 0,0610 0,0613 0,1386 0,1404 0,0059 0,0076 
4 0,0149 0,0153 0,1809 0,1755 0,0159 0,0189 
5 0,0029 0,0031 0,1849 0,1755 0,0339 0,0378 
6 0,0005 0,0005 0,1541 0,1462 0,0596 0,0631 
7 0,0001 0,0001 0,1076 0,1044 0,0889 0,0901 
8 0,0000 0,0000 0,0643 0,0653 0,1148 0,1126 
9 0,0000 0,0000 0,0333 0,0363 0,1304 0,1251 
10 0,0000 0,0000 0,0152 0,0181 0,1319 0,1251 
11 0,0000 0,0000 0,0061 0,0082 0,1199 0,1137 
12 0,0000 0,0000 0,0022 0,0034 0,0988 0,0948 
13 0,0000 0,0000 0,0007 0,0013 0,0743 0,0729 
14 0,0000 0,0000 0,0002 0,0005 0,0513 0,0521 
15 0,0000 0,0000 0,0001 0,0002 0,0327 0,0347 
MAPLE 


Nadzieja matematyczna oraz wariancja w rozkładzie Poissona wyrażają się wzo- 
rami: 


E(X) = À, AXISA 


6.1.3 Rozkład hipergeometryczny 


Rozkład P nazywamy hipergeometrycznym, jeżeli istnieją liczby naturalne Nin 
oraz liczby dodatnie p i q takie, że p +q = 1 oraz dla każdego k = 0,1,2,...n 


zachodzi równość: 
Np Nq 
k n=-k 
P(k) = i 


U 


Mamy tutaj do czynienia z uogólnionym symbolem Newtona (Np nie jest na ogół 
liczbą naturalną). Symbol ten definiuje się dla z € R oraz k € N w sposób nastpujący: 


(.) r(x — 1)...(r—k+1) 


k| k! 3 


co oczywiście jest zgodne ze standardową definicją, gdy z jest liczbą naturalną. 
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MAPLE 


Poniższy wykres przedstawia rozkład hipergeometryczny o parametrach N = 50, 
n = 5 oraz p = 0.4. 


0.47 


0.24 


6.4 PRZYKŁAD — Losowanie bez zwracania 

Przypuśćmy, że pewna populacja składa się z N elementów. Niech p będzie prawdo- 
podobieństwem tego, że dany element z tej populacji ma pewną własność, powiedzmy 
własność A. Losujemy bez zwracania n elementów i oznaczamy przez X liczbę wy- 
losowanych elementów mających własność A. Dość łatwo zauważyć, nawiązując do 
przeprowadzonych w punkcie 2.2 rozważań dotyczących losowania ze zwracaniem, 
że zmienna losowa X ma rozkład hipergeometryczny. 


Nadzieja matematyczna oraz wariancja w rozkładzie hipergeometrycznym wyra- 
żają się wzorami: 


E(X) = np, *(X) = npq 


6.5 UWAGA 

Przy losowaniu n elementów ze zwracaniem i przy losowaniu n elementów bez zwra- 
cania z populacji o liczebności N z frakcją elementów wyróżnionych, losujemy śred- 
nio tyle samo elementów wyróżnionych. Zauważmy jednak, że przy losowaniu bez 
zwracania wariancja jest mniejsza. 


6.2 Rozkłady czasu oczekiwania 


e Jak długo trzeba rzucać kostką, aby wypadła „szóstka” ? 
e Jak długi jest czas oczekiwania na kolejne zgłoszenie do centrali telefonicznej? 
e Jak często dochodzi do wypadków drogowych? 


Podobnie jak w poprzednim punkcie, omówimy tutaj kilka typowych rozkładów 
prawdopodobieństwa, które na ogół występują, gdy rozważamy zmienną losową bę- 
dącą czasem czekania na określone zdarzenie. 
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6.2.1 Rozkład geometryczny 


Rozkład P jest rozkładem geometrycznym, jeżeli istnieją liczby p i q takie, że 0 < p, 
q <1, p+q = 1 oraz zachodzi równość: 


P(k)=q" p dlak=1,2,3,... 


MAPLE 


Następujący wykres przedstawia rozkład geometryczny o parametrze p = 0.25: 


0.24 


Zauważmy, że jest to rozkład dyskretny skupiony na zbiorze nieskończonym. 

Rozkład geometryczny jest związany z nieskończonym ciągiem niezależnych prób 
Bernoulliego. Wykażemy mianowicie, że czas oczekiwania na pierwszy sukces w ta- 
kim ciągu posiada właśnie rozkład geometryczny. Konkretną sytuację (oczekiwanie 
na pierwszą „szóstkę” ) omawia ćwiczenie 2.5. 


6.6 TWIERDZENIE 
Niech X1, X2, X3,... będą niezależnymi zmiennymi losowymi o takim sa- 
mym rozkładzie dwupunktowym. Wtedy funkcja: 


T = min{n > 1: A=), 


nazywana czasem oczekiwania na pierwszy sukces w nieskończonym ciągu 
prób Bernoulliego, jest zmienną losową o rozkładzie geometrycznym. 


Dowód. Zauważmy, że zdarzenie {T = n} jest takie samo jak zdarzenie: 
JT AGSOrA A EURE 
Z niezależności zmiennych losowych X; otrzymujemy: 
P(T =n P(X EDG ZO0DREJ) 
P(X =0)-...- P(Xn1 = 0) - P(Xn = 1) = tp. 
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Nadzieja matematyczna i wariancja w rozkładzie geometrycznym wyrażają się 
następującymi wzorami: 


MAPLE 


6.2.2 Rozkład wykładniczy 


Rozkład P nazywamy rozkładem wykładniczym, jeżeli istnieje taka liczba A > 0, 
że funkcja f: R — R, określona wzorem: 


Gee 0 dlaz<0 
T=] ae dlax> 0, 
jest gęstością tego rozkładu. 


MAPLE 


Poniższy wykres przedstawia rozkład wykładniczy o parametrze A = 0.25. 


0.25 | 


0 5 10 15 20 


Wykres ten oraz wykres ze strony 98 sugerują, że między rozkładem geometrycz- 
nym i wykładniczym mogą istnieć pewne związki. Tak rzeczywiście jest — będzie to 
uzasadnione poniżej. 
Jak łatwo sprawdzić, dystrybuanta tego rozkładu wyraża się wzorem: 
z 0 dlaz<0 
(z) [rod ze. dla z > 0. 


MAPLE 
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Nadzieja matematyczna oraz wariancja w rozkładzie wykładniczym wyrażają się 


wzorami: 1 


AŻ: 

Spróbujemy teraz uzasadnić, że rozkład wykładniczy jest ciągłym odpowiedni- 
kiem rozkładu geometrycznego. Mówiąc niezbyt ściśle, pokażemy, że czas oczeki- 
wania na pierwszy sukces w nieskończonym ciągu niezależnych prób Bernoulliego 
ma w przybliżeniu rozkład wykładniczy o parametrze A, o ile czas pomiędzy ko- 
lejnymi próbami jest bardzo mały, a prawdopodobieństwo sukcesu w pojedynczej 
próbie jest małe i wprost proporcjonalne do tego czasu, przy czym parametr A jest 
współczynnikiem tej proporcjonalności. 

Niech A > 0 będzie ustalone. Oznaczamy: 


(X) = >, (X) = 


p= ps = XÓ dla każdego ô > 0. 


Niech X1, X2, X3,... będzie ciągiem niezależnych zmiennych losowych, z których 
każda ma rozkład dwupunktowy o parametrze p oraz niech: 


T = ômin{n > 1: Xn = 1}. 
Oznaczmy przez F dystrybuantę rozkładu wykładniczego o parametrze A. 


6.7 TWIERDZENIE 
Dla każdego t € R: 


Fr(t) — F(t), gdy 6—0. 


Dowód. Dla t < 0 sytuacja jest trywialna. Niech zatem t > 0. Zauważając, że 
T 


zmienna losowa 4 ma rozkład geometryczny (patrz twierdzenie 6.6) i oznaczając 
część całkowitą liczby t przez n, mamy kolejno: 


Fr(t)= P(T <t)=1- P(T >t)=1 PIZ>3=1 ; (lepi 
k=n+1 


-1-(1-p?=1-(1- 0) —1-67%— Ft), 


przy ô — 0, gdyż O<rg=ż-n<l. 


6.3 Rozkład normalny 


Chyba najważniejszym ze znanych rozkładów jest tak zwany rozkład normalny, ok- 
reślany niekiedy jako rozkład Gaussa. 


Rozkład P nazywamy rozkładem normalnym, jeżeli istnieją takie liczby rzeczy- 
wiste m oraz o > 0, że funkcja f: R — R, określona wzorem: 


1 c—m 
f(x) = eTa) dla x € R, 
2T 
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jest gęstością tego rozkładu. 


Stosowana w tym przypadku notacja jest następująca: N(m,o) oznacza rozkład 
normalny o parametrach m oraz o — jego dystrybuantę oznaczamy przez ®m,o. Wy- 
kres gęstości rozkładu normalnego nosi nazwę krzywej Gaussa. 


MAPLE 


Poniższy wykres przedstawia gęstości rozkładów N(20,1), N(20,2) i N(20,3), 
przy czym większym wartościom o odpowiada bardziej stromy wykres. 


0.44 


0.34 


0.24 


0.14 


01612 14 16 18 20 22 24 26 28 30 


Kolejny wykres przedstawia gęstości rozkładów N(15,3), N(20,3) i N(25,3). 


Dystrybuantę ®o,ı oznaczamy krótko przez $. Wyraża się więc ona następującym 
wzorem: 
6(a)=—— | o (61) 
c) =—— e i . 
2T J—oo 
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Poniższy wykres przedstawia gęstość rozkładu N(0,1), który nazywamy stan- 
dardowym rozkładem normalnym. Zauważmy, że zakreskowany obszar posiada pole 
równe $(1). 


Wartości dystrybuanty © zostały stablicowane (patrz strona 104) oraz są dostępne 
w wielu komputerowych programach matematycznych lub statystycznych. Oczywi- 
ście, pakiety statystyczne programu Maple zawierają odpowiednie procedury (ja- 
kie?). 

Zwróćmy uwagę na dwie własności funkcji ©, posiadające (przede wszystkim) 
rachunkowe znaczenie. Wynikają one bezpośrednio ze wzoru (6.1) i mają oczywistą 
interpretację geometryczną (ćwiczenie). Mianowicie: 


1 
(0) = z Oraz (x) = 1 — (—zx) dla każdego x € R 


oraz 
l(a) = —P7!(1 — a) dla każdego a € [0,1]. 


Użyteczność powyższych wzorów można zaobserwować zwłaszcza wtedy, gdy nie 
dysponujemy odpowiednim pakietem komputerowym czy kalkulatorem, ale są one 
także ważne przy pewnych przekształceniach. Podobnie następna równość, którą 
można otrzymać stosując prostą zmianę zmiennych, pozwala za pomocą $ obliczać 
dystrybuanty ©m,s dla pozostałych parametrów m i o. Mianowicie: 


5,.o(2) = © (= 5 =) (6.2) 


o 


MAPLE 


Parametry m i o mają bardzo wyraźną interpretację probabilistyczną. Okazuje 
się bowiem, iż nadzieja matematyczna oraz wariancja w rozkładzie N(m,o) wyrażają 
się wzorami: 


E(X) = m, (X) =0°. 
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Zauważmy też, że m jest punktem, w którym gęstość rozkładu N(m,o) osiąga 
wartość największą, prosta x = m jest osią symetrii jej wykresu, zaś punkty m — o 
im + o — punktami przegięcia. 


6.8 PRZYKŁAD 
Postaramy się uzasadnić ilościowo, że parametr o jest miarą „rozrzutu rozkładu 
N(m,o), względem punktu m. Obliczmy w tym celu: 


rh = P(m — ko,m + ko) dlak=1,2,3, 
gdzie P jest rozkładem N (m, o). Otrzymujemy: 
Tk = Öm o (M + ko) — m (m — ko) = $(k) — $(—k) = 28(k) — 1. 
Korzystając z tablic lub z komputera, bez trudu dostajemy: 


rı = 0.682689492, ro ~ 0.954499736, r3 = 0.997300204. 


Tak więc szansa znajdowania się poza przedziałem (m — 30, m + 30) wynosi istot- 
nie mniej niż 1%. Im mniejszy jest parametr o, tym bardziej rozkład N (m, c) jest 
„skupiony w okolicy” punktu z = m. 


Jak powyżej wspomnieliśmy, rozkład normalny jest bardzo ważnym rozkładem. 
Dzieje się tak między innymi dlatego, że wiele zjawisk przyrodniczych, społecznych 
i innych przebiega zgodnie z tym rozkładem. Ma on również olbrzymie znaczenie 
teoretyczne. Poniżej przedstawiamy tak zwane centralne twierdzenie graniczne, które 
częściowo wyjaśnia znaczenie rozkładu normalnego. Twierdzenie to gwarantuje, że 
(pod pewnymi dość naturalnymi założeniami) suma dużej ilości niezależnych zmien- 
nych losowych ma w przybliżeniu rozkład normalny. 

Na zakończenie tego punktu wypowiemy jeszcze jedno ważne twierdzenie doty- 
czące rozkładu normalnego. 


6.9 TWIERDZENIE 
Niech X, oraz Xə będą niezależnymi zmiennymi losowymi o rozkładach 
normalnych, odpowiednio N(m4,01) oraz N(ma,02). Wtedy: 


1. X1 + X2 ~ N(m + m2, 4/0? +03), 


2. aXı +b ~ N(amı +b,|a|o1) dla wszystkich a,b € R. 
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Dystrybuanta ® rozkładu normalnego N(0,1)! 


w 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 


0,0 | 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 
0,1 | 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 
0,2 | 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 
0,3 | 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 
0,4 | 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 
0,5 | 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 
0,6 | 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 
0,7 | 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 
0,8 | 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 
0,9 | 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 


1,0 | 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 
1,1 | 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 
1,2 | 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 
1,3 | 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 
1,4 | 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 
1,5 | 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 
1,6 | 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 
1,7 | 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 
1,8 | 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 
1,9 | 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 


2,0 | 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 
2,1 | 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 
2,2 | 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 
2,3 | 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 
2,4 | 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 
2,5 | 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 
2,6 | 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 
2,7 | 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 
2,8 | 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 
2,9 | 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 
3,0 | 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 


6.3.1 Centralne twierdzenie graniczne 


Ze względu na wagę centralnego twierdzenia granicznego wypowiemy je w trzech 
wersjach. Pierwsza z nich — do niedawna najczęściej używana — ma w dobie kom- 
puterów mniejsze znaczenie praktyczne, jednak w dalszym ciągu jest najbardziej 
popularna. 


Założenie. 

(Q, ©, P) jest przestrzenią probabilistyczną, zaś X1, X2, X3,... — ciągiem 
niezależnych zmiennych losowych określonych na Q. Wszystkie zmienne 
losowe X; mają taki sam rozkład, a ich wspólna nadzieja matematyczna 
m oraz wariancja o? istnieją i są skończone, przy czym o > 0 (ten 


"W tablicy podano wartości $(x) dla z € [0, 3.09]. 
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ostatni warunek oznacza, że zmienne losowe nie są stałymi). Jak zawsze 


oznaczamy: 
Sn=X1+...+ Xp. 


Będziemy badać najpierw zbieżność tak zwanych sum standaryzowanych, a do- 
piero potem wyciągniemy wnioski dotyczące samych sum 5, oraz średnich Sn, 
Zmienną losową: 


D2(5,) oyn 


nazywamy standaryzacją sumy Sn. Jak łatwo zauważyć: 


= 


E(Za)=0 oraz D?(Sn)=1. 


6.10 TWIERDZENIE — Lindeberga-Lévy’ego 
Dla każdego x € R zachodzi równość: 


lim P(Zn <S £) = (x), 


n—> oo 


gdzie © jest dystrybuantą rozkładu N (0,1). 


Dowód tego twierdzenia jest długi i skomplikowany, więc nie przytaczamy go 
tutaj. 


Twierdzenie Lindeberga-Lóvy' ego można wypowiedzieć w wersjach bardziej na- 
turalnych — bez używania standaryzacji Zn. 


6.11 TWIERDZENIE — Centralne tw. graniczne dla sum 
Rozkład zmiennej losowej Sn jest asymptotycznie równy rozkładowi N (nm, oyn). 
Inaczej: 


lim (Fs, (x) — Do EJ) = 0, 


n—> oo 


dlaxeR. 


6.12 TWIERDZENIE — Centralne tw. graniczne dla średnich 
Rozkład zmiennej losowej Sn jest asymptotycznie równy rozkładowi N(m, Ja) 


Inaczej: 
lim (Fs, (z) — Øm 


n—> oo 


dlaxeR. 


6.13 PRZYKŁAD 

Zinterpretujemy twierdzenie 6.11, mówiące o rozkładzie sumy niezależnych zmien- 
nych losowych. Wyobraźmy sobie eksperyment polegający na wielokrotnym rzucie 
kostką do gry. Suma uzyskanych oczek S$ jest zmienną losową mającą, zgodnie z cy- 
towanym twierdzeniem, w przybliżeniu rozkład N(nm,oyn), gdzie m oraz o są 
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odpowiednio nadzieją matematyczną oraz odchyleniem standardowym zmiennej lo- 
sowej X, reprezentującej wynik pojedynczego rzutu, a n jest liczbą wykonanych prób. 
Ponieważ X ma rozkład dyskretny, skupiony w punktach 1, 2,3,4,5,6 przyjmowa- 
nych z jednakowym prawdopodobieństwem z, więc bez trudu można stwierdzić, że: 


105 
m = 3.5 oraz o = —— £1.1018251. 


Przypuśćmy, że wykonano 1000 rzutów (n = 1000). Wówczas suma S1000 Ma w przy- 
bliżeniu rozkład N (3500, 54, 00617). 


Zweryfikujmy „doświadczalnie” uzyskany wynik. W tym celu można przeprowa- 
dzić symulację tysiąca rzutów kostką za pomocą komputera, uzyskując odpowiednią 
wartość sumy wszystkich uzyskanych oczek. Doświadczenie to powtórzymy 400 ra- 
zy, uzyskując 400 wartości sumy oczek. Poniżej przytaczamy kod programu Maple, 
umożliwiający przeprowadzenie takiej symulacji. 

> kostka := rand(1..6): 


> k := 400: n := 1000: lista := NULL: 
> from 1 to kdo 
> S := 0: 
> from 1 to n do 
> S := S + kostka(): 
> od: 
> lista := lista,S 
> od: 
MAPLE 


Aby graficznie zinterpretować otrzymane dane, najpierw sporządzamy odpowied- 
ni szereg rozdzielczy (rozważamy 18 klas) i rysujemy histogram Teraz rysujemy hi- 
stogram: 


.008 - 


.006 - 


.004 4 


.002 4 


03300 3400 3500 3600 3700 
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Na tym samy rysunku narysujemy gęstość rozkładu normalnego o parametrach 
obliczonych powyżej, a także gęstość rozkładu normalnego o parametrach obliczo- 
nych na podstawie wygenerowanych danych. Obliczamy mianowicie średnią i odchy- 
lenie standardowe: 


> ee := evalf(stats[describe,mean] ([lista])); 
ee := 3501.587500 
> ve := evalf(stats[describe,standarddeviation] ([lista])); 


ve := 57.07764311 


„008 4 


-006 - 


.004 - 


„002 | 


03300 3400 _ 3500 _ 3600 _ 3700 


Ponieważ bardzo często zmiennymi losowymi są niezależne próby Bernoullie- 
go, więc sformułujemy centralne twierdzenie graniczne specjalnie dla tego przypad- 


ku. Jest to natychmiastowy wniosek z twierdzenia Lindeberga-Lóvy ego (twierdzenie 
6.10). 


6.14 TWIERDZENIE — de Motvre'a-Laplace'a 
Niech X1, X2, X3,... będzie ciągiem niezależnych prób Bernoulliego, z ta- 
kim samym prawdopodobieństwem sukcesu p i porażki q = 1 — p w każdej 
próbie (O < p < 1). Wtedy: 


dla każdego x € R. 


Oczywiście, twierdzenia 6.11 i 6.12 można także z łatwością przeformułować dla 
przypadku niezależnych prób Bernoulliego. 


6.15 UWAGA 

Wyraźnie zaznaczamy, że centralne twierdzenie graniczne jest prawdziwe przy dużo 
ogólniejszych założeniach. W szczególności zmienne losowe nie muszą mieć takie- 
go samego rozkładu, a nawet nie muszą być niezależne. Jednakże, różnym wersjom 
centralnego twierdzenia granicznego przyświeca ta sama idea: 


suma niewiele zależnych od siebie składników losowych, z których żaden 


nie dominuje istotnie nad pozostałymi, ma w przybliżeniu rozkład nor- 
malny. 
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6.4 Cwiczenia i zadania 


Ćwiczenie 6.1 Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona. 
Otrzymujemy: 


OO MA = DO Ę 1 


AŚ DI 


= =a E Me a aN 


00 00 00 00 k 

(X) =) (k -AF = 8 k? aà > kac 3 > aea 

k=0 k! ! SĘ rz” k! 
00 AF-1 00 aa 00 AF 
=) (* De" Di +Ae 0") —— t=M -AD ke - + żę DA 
k=1 f k=1 i k=0 " 


= AX +A- 2A +A A. 


Ćwiczenie 6.2 Porównamy graficznie rozkład dwumianowy o parametrach n = 50 i 
p= 0.1 (kolor niebieski) z rozkładem Poissona o parametrze A = 5 (kolor czerwony). 


MAPLE 


Oto właściwy rysunek: 


Ćwiczenie 6.3 Udowodnimy podane poprzednio wzory na wartość oczekiwaną i wa- 
riancję w rozkładzie wykładniczym. 
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Otrzymujemy: 


| c maj 
= e 
X2 o 


Ćwiczenie 6.4 Przypuśćmy, że ze zbioru N-elementowego losujemy w kolejnych 
momentach czasu po jednym elemencie, przy czym jest to losowanie ze zwraca- 
niem. Interesuje nas średnia długość czasu oczekiwania na wylosowanie r różnych 
elementów. 


Niech T oznacza interesujący nas czas. Nie jest całkiem widoczne, jak wyznaczyć 
rozkład T, jednak samą nadzieję matematyczną można obliczyć stosunkowo łatwo. 
Zauważmy w tym celu, że gdy w pewnym momencie mamy już wylosowanych n 
różnych elementów, to czas oczekiwania 7, na pojawienie się następnego, różnego 
od nich, elementu jest zmienną losową o rozkładzie, którego charakter jest w istocie 
taki sam jak rozkład czasu oczekiwania na pierwszą „szóstkę”. Mianowicie, 1, ma 


rozkład: 
ZL N-n 


P(T, = k) = (>) po 85 1,2,3,... 


— jest to więc rozkład geometryczny o parametrze p = ® No 


W związku z powyższym, zmienna losowa 1, ma określoną nadzieję matema- 
tyczną i wariancję: 


Zauważmy teraz, że: 
T = Tọ + Ti +... + Tp], 


a więc: 
r—i r—i 
N 
= E(Ta) = i 
> (Tr) 2 N-n 
n=0 n=0 
Ponieważ zmienne losowe Tọ, 71,...,1,_1 są niezależne, mamy także: 
r_l r_l 
Nn 
2 2 
T) = D (Ta) = ——. 
2 S L Nn 
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MAPLE 


Wykorzystując wspomaganie komputerowe (na przykład program Maple), ob- 


liczmy nadzieję i wariancję w kilku szczególnych przypadkach: 


N = 100, r = 30: 
N = 200, r = 100: 
N = 200, r = 190: 
N = 100, r = 8: 


E(T') = 35.45407600, 


E(T) x 138.1306861, 


E(T) x 589.8125388, 


E(T) = 8.294833858, 


2(X) m 6.885850949, 
2(X) ~ 60.37514711, 
2(X) ~ 3017.340055, 
2( X) ~ 0.3105547438. 


Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją — gdy chcemy wylosować 
niewiele elementów, wystarczy niewiele losowań, a ponieważ wariancja, będąca miarą 
rozrzutu, jest mała, mamy właściwie pewność, że do wylosowania 30 różnych ele- 
mentów potrzebujemy 40 lub niewiele więcej losowań. Natomiast, gdy chcemy mieć 
dużo, w porównaniu z liczebnością populacji, elementów różnych, liczba losowań 
musi być duża, a jej konkretne przewidywanie jest obarczone poważnym błędem. 

Otrzymane wyniki mogą być wykorzystane do określenia wielkości populacji na 
podstawie próbki. Jeżeli, na przykład, w 12 losowaniach uzyskamy jedynie 8 ele- 
mentów różnych, możemy przypuszczać, że wielkość populacji jest nieco mniejsza 
niż 100. Statystyka matematyczna podaje metody, jak w miarę precyzyjnie określić 
wielkość populacji oraz, przede wszystkim, jak precyzyjnie postawić problem. 


Ćwiczenie 6.5 Rzucono 1000 razy symetryczną kostką do gry. Oblicz prawdopodo- 
bieństwo tego, że „szóstka” wypadła więcej niż 150 razy. 


Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas ilość „szó- 
stek” jest sumą 1000 niezależnych prób Bernoulliego o prawdopodobieństwie sukcesu 
p= t w każdej próbie (oznaczymy ją, tradycyjnie, przez S1000). Zgodnie z central- 
nym twierdzeniem granicznym (patrz twierdzenia 6.11), suma ta ma w przybliżeniu 
rozkład N(np, ,/npq). Wstawiając wartości liczbowe i korzystając ze wzoru (6.2), 
otrzymujemy: 


P( S1000 > 150) =]- P( S1000 << 150) xi- (150) 


1000-5,4/ 1000 


„1.5 
6 6 


150 — 1000 
=1-69 6_ | z 1— $(—1.41) = ©(1.41) = 0.9207, 
| 2990 


gdzie ostatnia liczba pochodzi z tablic rozkładu normalnego. 


Ćwiczenie 6.6 Jakie jest prawdopodobieństwo, że przy 1000 rzutach monetą syme- 
tryczną, różnica między ilością reszek i orłów będzie wynosić co najmniej 100? 
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Podobnie jak poprzednio, ilość uzyskanych orłów jest sumą 1000, niezależnych 
prób Bernoulliego (S1000) © prawdopodobieństwie sukcesu p = A w pojedynczej 


próbie. Chcemy obliczyć: 
P(|Sio00 — (1000 — Sio00)| > 100) = P(|S1000 — 500| > 50). 
Zauważmy, że prawdopodobieństwo zdarzenia przeciwnego jest równe: 


Fs1000 (550) z FS1000 (450) sz ©500,510(950) s ©500,5,10(450) 


= (v10) — 8(-v10) = 29(V10) — 1 ~ 29(3.16227766) — 1 ~ 0.9984346. 


Tak więc interesujące nas prawdopodobieństwo wynosi w przybliżeniu równe 0.0016. 


Ćwiczenie 6.7 Wykonano 10* dodawań, z dokładnością 107$ w każdym. Jakim błę- 
dem obarczona jest suma? 


Zwróćmy uwagę, że tak postawiony problem nie ma większego sensu — w naj- 
bardziej optymistycznym przypadku, gdy wszystkie dodawania były dokładne, błąd 
sumy jest równy zeru, zaś w najgorszym wypadku wynosi on 10*107$ = 1074. Spre- 
cyzujmy więc nasze zadanie i spróbujmy znaleźć taki przedział, w którym mieści się 
błąd sumy z prawdopodobieństwem co najmniej 0.99. 

Oznaczając błędy powstające w kolejnych dodawaniach przez X;, i = 1,..., 10%, 
widzimy, że błąd sumy jest znowu sumą 510000. Poszukujemy zatem takich liczb a 
ib, że: 

P(S10000 € (a,b)) > 0.99. 
Zauważmy, że chociaż zadanie może mieć wiele rozwiązań, jednak w tym przypadku 
najrozsądniejsze wydaje się szukanie możliwie najmniejszego przedziału, symetrycz- 
nego względem punktu 0 (czasem ważniejsze są inne przedziały, na przykład nie- 
ograniczone, ale zawsze decyduje o tym specyfika konkretnego problemu). Szukamy 
więc ostatecznie możliwie najmniejszej liczby e > 0, dla której: 


P(|S10000| < e) > 0.99. 


Z założenia wiemy, że wszystkie zmienne losowe X; mają taki sam rozkład jed- 


nostajny na przedziale (-3 - 1078, > 1075) i dlatego ich nadzieja matematyczna m 


jest równa 0, zaś odchylenie standardowe o wynosi z,g10*. Mamy więc: 


P(|$10000| < e) z” Fool) = Feico =) = 29(8) =i 


gdzie (ćwiczenie) 8 = 2v3 : 106e. 
W tablicach znajdujemy, że najmniejszym 6 spełniającym warunek: 


26(8) — 1 > 0.99, 
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czyli: 
(6) > 0.995, 


jest 6 = 2.58. Tak więc: 
e m 0.745 - 10 * 


jest szukaną przez nas liczbą. Zauważmy, że zmniejszając nasze żądania co do pew- 
ności wyniku, możemy zwiększyć jego dokładność. Przykładowo, gdybyśmy zażądali, 
aby: 

P(|Sn| < e) > 0.9 


(tylko 90% pewności zamiast 99%), to powtarzając poprzednie rachunki, można 
stwierdzić, że szukana liczba to: 


e = 0.476 - 107°. 


Ćwiczenie 6.8 Aby stwierdzić, jak wielu wyborców popiera obecnie partię ABC, 
losujemy spośród nich repreżentatywną próbkę i na niej przeprowadzamy badanie. Jak 
duża powinna być ta próbka, aby uzyskany wynik różnił się od rzeczywistego poparcia 
dla partii ABC nie więcej niż o b = 3%, z prawdopodobieństwem co najmniej 1—a = 
0.957 


Niech p € (0,1) oznacza faktyczne (lecz nieznane) poparcie dla partii ABC. 
Jeżeli próbka składa się z n osób, z których Sp wyraziło poparcie dla ABC, to liczba 
En jest poparciem wyznaczonym na podstawie próbki. Możemy założyć, że S, jest 
sumą niezależnych zmiennych losowych X; o rozkładzie: 


P(X; =0)=1-p, P(X; =1) =p. 


Chcemy znaleźć takie n, aby: 
S 
P (|> -x <p) >l-a. 
n 


Sn 


R SIE” A 3 z p(1-p) 
Ponieważ średnia arytmetyczna #2 ma w przybliżeniu rozkład N (r, m) 


(patrz twierdzenie 6.12), więc powyższa nierówność jest (w przybliżeniu) równoważ- 
na następującej nierówności: 


zo ( WAĆ 1>żl-a, 


p(l — p) 


która jest z kolei równoważna nierówności: 


e a 2 
(| 3) (Api: 


2W sierpniu 2006 partia taka jeszcze nie istniała... 
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Chociaż nie znamy p, wiemy, że: 


1 


1-p)p<—. 
(1—p)p 4 


W takim razie liczba naturalna n, spełniająca nierówność: 
2 
(1-5 
> 0.25- (==) , 


określa wystarczającą wielkość próbki. Podstawiając b = 0.03 i œ = 0.05, otrzymu- 
jemy: 
> 1067. 


Jeżeli jeszcze przed losowaniem próbki mamy wstępne informacje o poparciu dla 
partii ABC — na przykład wiemy, że poparcie to jest mniejsze niż 20% — możemy 
powyższy wynik znacznie polepszyć: w tym przypadku p < 0.2, a więc (1—p)p < 0.16, 
co oznacza, że n > 683 jest wystarczającą wielkością próbki. 


Zadanie 6.1 Oblicz (skorzystaj, w miarę potrzeby, z tablic lub komputera): 


1. P(X > 1), gdy X ma rozkład wykładniczy z parametrem A= 1, 


> 
2. P(X? > 1), gdy X ma rozkład jednostajny na odcinku (—2,3), 
> 


3. P(X >4), gdy X ma rozkład geometryczny z parametrem p = 0.1, 


( 
( 
( 
4. P(|X-5| > 2), gdy X ma rozkład dwumianowy z parametrami n = 8i p = 0.2, 


5. P(X —5| > 2), gdy X ma rozkład dwumianowy z parametrami n = 80 
ip=0.02 (w tym przypadku są dwa różne, praktyczne sposoby). 


Uzyskane wyniki zilustruj geometrycznie. 


Zadanie 6.2 Wylosuj 200 liczb według: (a) rozkładu dwupunktowego (0, 1,0.3), 
(b) rozkładu jednostajnego na odcinku U(0,10), (c) rozkładu dwumianowego z pa- 
rametrami 10 i 0.6. Oblicz w każdym przypadku nadzieję matematyczną i wariancję 
oraz porównaj je z wartościami teoretycznymi. 


Zadanie 6.3 Jakie jest prawdopodobieństwo tego, że wśród 200 losowo wybranych 
osób znajdują się co najmniej cztery osoby leworęczne, jeżeli przyjmiemy, że takie 
osoby stanowią 1% całej populacji? Jak duża powinna być grupa osób, aby z praw- 
dopodobieństwem 0.95 lub większym, co najmniej jedna osoba w tej grupie była 
leworęczna? 
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Zadanie 6.4 Ile rodzynek podczas wyrabiania ciasta trzeba średnio przeznaczyć 
na bułeczkę, aby losowo wybrana bułeczka zawierała co najmniej jedną rodzynkę 
z prawdopodobieństwem 0.95 lub większym? 


Zadanie 6.5 Dwóch ludzi wykonuje n rzutów monetą symetryczną. Jakie jest 
prawdopodobieństwo tego, że obaj otrzymają tyle samo orłów? 


Zadanie 6.6 Ze stawu, w którym pływa N ryb, w tym M ryb jadalnych, odłowiono 
n ryb. Jaka jest oczekiwana liczba odłowionych ryb jadalnych? 


Zadanie 6.7 Niech qp będzie kwantylem rzędu p w rozkładzie N(0,1). Oblicz 
kwantyl rzędu p w rozkładzie N(m,o). 


Zadanie 6.8 Zaprojektuj i przeprowadź eksperyment komputerowy, który weryfi- 
kuje centralne twierdzenie graniczne. 


Zadanie 6.9 Prawdopodobieństwo zapłacenia kary za jazdę bez biletu wynosi 0.02. 
Jakie jest prawdopodobieństwo tego, że w trakcie 100 takich przejazdów co najmniej 
raz zapłacimy karę? Podaj dwa sposoby rozwiązania. 


Zadanie 6.10 Przeprowadź symulację komputerową poprzedniego zadania: wylo- 
suj 20 serii po 100 przejazdów w każdej serii i zobacz, ile razy w każdej serii płaciło 
się karę. 


Zadanie 6.11 Wykonano 1000 rzutów monetą symetryczną. Jakie jest prawdo- 
podobieństwo tego, że liczba orłów zawiera się w przedziale: (a) (490,510), (b) 
(450,550), (c) (500,600). Przed przystąpieniem do rozwiązywania podaj przewi- 
dywane wyniki w celu późniejszego porównania. 


Zadanie 6.12 Ile razy należy rzucić kostką do gry, aby mieć 99% pewności, że 
„szóstka” pojawi się co najmniej w 15% wszystkich rzutów? 


Zadanie 6.13 Zakładając, że 90% osób przekraczających granicę nie popełnia żad- 
nego wykroczenia celnego oraz wiedząc, że osoba, która takie wykroczenie popełnia, 
jest ujawniana z prawdopodobieństwem 0.2, oblicz prawdopodobieństwo tego, że 
spośród tysiąca osób przekraczających granicę, będzie ujawnionych co najmniej 10 
przypadków popełnienia wykroczenia. 


Zadanie 6.14 Dokumentacja linii lotniczej XYZ wskazuje na to, że na lot w klasie 
business do Tokio zgłasza się średnio 6.72 pasażera. Ile miejsc w tej klasie należy 
przygotować na następny lot, aby mieć 90% pewności, że wszyscy chętni dostaną 
miejsce w klasie business. 


Zadanie 6.15 Pewną trasą, obsługiwaną przez dwie całkowicie równorzędne linie 
lotnicze, lata codziennie 1000 osób. Ile miejsc powinna przygotować każda z tych 
linii, aby obsłużyć 95% klientów, którzy się do niej zgłoszą? 


114 


Zadanie 6.16 Ile osób należy przebadać, aby mieć 95% pewności, że wyznaczona 
na jej podstawie frakcja ludzi palących (liczba palaczy do liczebności całej populacji) 
jest obarczona błędem mniejszym niż 0.005? 


Zadanie 6.17 Wykonaj 100 serii po 60 rzutów monetą symetryczną, znajdując 
w każdej serii liczbę uzyskanych orłów S60. 


1. Narysuj histogram dla wartości Sg0. 
2. Oblicz teoretyczną średnią i odchylenie standardowe zmiennej losowej S60. 


3. Oblicz średnią i odchylenie standardowe zmiennej losowej S60, na podstawie 
uzyskanej 100-elementowej próbki. 


4. Oblicz P(|S6o = 30| < 5). 
5. Ile spośród obliczonych sum Sgo spełnia warunek |Sgo — 30| < 5? 


Zadanie 6.18 Niech S, oznacza sumę orłów uzyskanych w trakcie n rzutów mo- 
netą symetryczną. Niech e > 0 będzie dowolną liczbą. 


1. Oblicz: 


(a) lim P(|s- 


n— oO 


(b) lim P ( Sp 


n— o0 


NIS NIS NIS 


(c) lim P(|s- 


2. Wykaż, że: 
(a) lim P(I5,— (n-$,)|>e)=1, 
n — Sn 


n 


r im p( 


— . > e) =l. 
Zinterpretuj powyższe wyniki. 
Zadanie 6.19 Niech R oznacza liczbę różnych elementów, otrzymanych podczas 


150 losowań ze zwracaniem ze zbioru 200-elementowego. Wykonując odpowiednią 
symulację komputerową, określ charakter rozkładu zmiennej R. 
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Rozdział 7 


Wnioskowanie statystyczne 


7.1 Pojęcia podstawowe 


Jak pamiętamy, statystyka opisowa dotyczy sytuacji, w których mamy do czynienia 
z pewną cechą (lub cechami) elementów określonej populacji oraz znamy wartość tej 
cechy dla każdego jej elementu (lub przynajmniej znamy dane zgrupowane w szere- 
gu rozdzielczym). Z zupełnie innym problemem mamy do czynienia w przypadku, 
gdy znamy wartości cechy tylko dla pewnej liczby elementów, a chcemy tę cechę 
jakoś scharakteryzować w odniesieniu do całej populacji. Na przykład, wyniki jakie 
podaje komisja wyborcza po przeliczeniu wszystkich oddanych głosów pozwalają 
jednoznacznie podać procent wyborców popierających daną partię, powiedzmy par- 
tię ABC. Jest to zrobione na podstawie danych o każdej osobie, która poszła do 
wyborów. Natomiast sondaż przeprowadzany przez ankieterów przed lokalami wy- 
borczymi dotyczy tylko niewielkiej części głosujących, a jednak na jego podstawie 
jest podawany procent wyborców popierających partię ABC. Jest to możliwe dzięki 
metodom tak zwanego wnioskowania statystycznego. 

Wymienimy poniżej trzy typowe problemy, które dają się rozwiązać metodami 
wnioskowania statystycznego. Ogólny kontekst jest w każdym przypadku taki sam: 
obserwujemy wartości pewnej cechy dla wybranych jej elementów i na tej podsta- 
wie chcemy odpowiedzieć na jedno z pytań, dotyczących konkretnego parametru tej 
cechy (na przykład jej wartości średniej). 


1. Ile wynosi parametr (na przykład średnia) naszej cechy w całej populacji? — 
Estymacja punktowa 


2. W jakim zakresie (zbiorze) znajduje się ten parametr” — Estymacja prze- 
działowa 


3. Czy prawdą jest, że nasz parametr należy do określonego zbioru? — Testo- 
wanie hipotez statystycznych 


Zauważmy, że tak sformułowane problemy są faktycznie niemożliwe do rozwiąza- 
nia. Przykładowo, nie możemy z całą pewnością, na podstawie sondażu przed lokala- 
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mi wyborczymi, jakie poparcie uzyskała partia ABC. Dlatego nasze pytania muszą 
zostać przeformułowane tak, aby można było na nie sensownie odpowiedzieć. Aby 
to zrobić, najpierw zbudujemy pewien model matematyczny, a następnie zajmie- 
my się kolejno rozwiązywaniem powyższych problemów. W tym miejscu zauważmy 
jeszcze tylko to, że są one ze sobą silnie związane — gdybyśmy umieli w pełni rozwią- 
zać problem estymacji punktowej, umielibyśmy też oczywiście rozwiązać problemy 
estymacji przedziałowej i testowania hipotez. 

Na początku zakładamy, że interesująca nas cecha X ma charakter losowy, czyli 
że jest ona zmienną losową (lub wektorem losowym) określoną na pewnej przestrzeni 
probabilistycznej, powiedzmy (0, >, P). W takim razie, interesujący nas parametr 
jest parametrem zmiennej losowej X lub, bardziej precyzyjnie, parametrem rozkładu 
Py tej zmiennej. Wówczas zamiast mówić, na przykład, o wartości średniej danej ce- 
chy, będziemy mówić o nadziei matematycznej odpowiadającej jej zmiennej losowej. 
Tak więc sformułowane powyżej pytania dotyczą parametrów rozkładu Py. 

Dość często możemy z góry założyć, że nasza cecha posiada rozkład określonego 
typu. Na przykład, gdy prowadzimy sondaż, nasza cecha ma rozkład dwupunktowy 
(0,1,p): „0” oznacza, że wyborca nie głosował na partię ABC, zaś „1” oznacza, że 
na tę partię głosował — nas natomiast interesuje parametr p, a właściwie p : 100%. 
Często też, korzystając z centralnego twierdzenia granicznego, można założyć, że 
dana cecha ma rozkład N(m,o) — wtedy parametr m odpowiada średniej wartości 
cechy, zaś o — jej odchyleniu standardowemu. 

W związku z powyższym, przyjmujemy ogólne założenie, że mamy ustaloną jakąś 
rodzinę rozkładów prawdopodobieństwa, indeksowaną przez pewien parametr 0 € © 
— będziemy pisać: 

P=1{P:0€ 0}. 


W pierwszym z powyższych przypadków P jest rodziną rozkładów dwupunktowych 
(0,1,p), a więc © jest przedziałem (0,1), zaś w drugim — P jest rodziną wszystkich 
rozkładów normalnych, zatem © jest iloczynem kartezjańskim R x (0, oo). Dopuszcza 
się też możliwość, że P jest zbiorem wszystkich możliwych rozkładów prawdopodo- 
bieństwa, czyli że © =P. 

Możemy teraz, przy powyższych założeniach i oznaczeniach, interesujące nas 
zagadnienia sformułować w następujący sposób: 


1 znaleźć 0 € © takie, że Px = Po, 
2 znaleźć zbiór Og C © taki, że Px = P dla pewnego 0 € 0%, 


3 czy prawdą jest, że Py = P dla pewnego 0 € Qg, gdzie Og jest z góry ustalo- 
nym zbiorem? 


Zauważmy jednak, iż tak sformułowane zadania są w dalszym ciągu niewykonal- 
ne, a zatem powinny zostać jeszcze trochę przeformułowane, czym zajmujemy się 
w kolejnym punkcie. 
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7.2 Model statystyczny 


Wracamy do budowy modelu matematycznego dla naszych zagadnień. 

Załóżmy, że obserwujemy ciąg zmiennych losowych, powiedzmy 
X1,..., Xn, określonych na przestrzeni probabilistycznej (Q, 2, P) (przypominamy, 
że na tej samej przestrzeni jest określona także zmienna losowa X, reprezentująca 
daną cechę), z których każda ma taki sam rozkład jak X, czyli: 


Py, = Px dlai=1,...,n. 


Tak zdefiniowany ciąg nazywa się próbką ze zmiennej losowej X — odpowiada on 
zaobserwowanym faktycznie wartościom cechy, powiedzmy 1,,...,x, (ten ostatni 
ciąg także nazywa się próbką wartości cechy, tak więc w dalszej części będziemy 
mówić po prostu o próbce, a z kontekstu będzie wynikać znaczenie, w jakim słowo to 
zostało użyte). Bardzo często zdarza się, iż obserwacje wartości cechy są niezależne 
od siebie — jeżeli tak jest, to ciąg 11,...,Tq nazywa się próbką prostą. W języku 
zmiennych losowych mówimy, że X,,..., X, jest próbką prostą, gdy zmienne losowe 
X1,..., Xn tworzą próbkę i są niezależnymi zmiennymi losowymi. W dalszej części 
będziemy rozważać tylko próbki proste. 
Wprowadzimy teraz dwa nowe terminy. 


7.1 DEFINICJA 
Statystyka nazywamy dowolną funkcję T: R” — RI, która jest mierzalna 
ze względu na o-algebrę zbiorów borelowskich B(R”), to znaczy: 


T"'(B) € B(R”) dla każdego B € B(R'). 


Okazuje się, iż zdecydowana większość rozważanych w praktyce funkcji R” — 
R” spełnia powyższą definicję. Zauważmy, ze jeżeli na przestrzeni R” określimy roz- 
kład prawdopodobieństwa, powiedzmy Q, to znaczy gdy (R”, B(R”), Q) jest prze- 
strzenią probabilistyczną, to statystyka T:R” — R* jest dźwymiarowym wektorem 
losowym, określonym na tej przestrzeni. 


7.2 DEFINICJA 
Niech X,,..., X, będzie próbką prostą ze zmiennej losowej X. Estymato- 
rem parametru zmiennej X nazywamy zmienną losową, będącą złożeniem 
wektora losowego (X1,..., Xn) że statystyką T, czyli funkcję: 


Doch asa: 


Opuszczając znak operatora złożenia „o”, co się często w praktyce czyni, możemy 
estymator oznaczyć (nieściśle) jako: 


R OWAcOGJ 
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7.3 PRZYKŁAD 
Przykładem statystyki jest średnia: 


T(z, += Zn) = Dictiw 
n 
a odpowiadającym jej estymatorem jest: 
X .+ xX 
nE E e E - >> 


Dla tej statystyki jak i tego estymatora zarezerwowano następujące oznaczenia: 
T lub Z„ oraz, odpowiednio, X lub X,. 


7.4 PRZYKŁAD 
Innym przykładem statystyki jest tak zwana statystyka pozycyjna: 


Minsc) = (20); -- TE); 


gdzie £(1),..-,Z(n) oznaczają elementy próbki z1,...,z ustawione w porządku ro- 
snącym: 


Estymator, jak każdy wektor losowy, posiada swój rozkład Pr(x;,..,x„), który 
będziemy w skrócie oznaczać symbolem Pr. Dość często utożsamia się statystykę 
T z odpowiadającym jej estymatorem T(X4,..., Xn) i w związku z tym mówi się 
także, że Pr jest rozkładem statystyki T. Oczywiście, rozkład Pr zależy w sposób 
jednoznaczny od rozkładu Px zmiennej losowej X, z której pochodzi próbka prosta. 
Istnieją twierdzenia, dzięki którym można w szczególnych przypadkach efektywnie 
wyznaczyć tę zależność. 


7.5 PRZYKŁAD 

Wiadomo (patrz twierdzenie 6.9), że gdy zmienna X ma rozkład N(m,o), to roz- 
kład Pr statystyki T = z jest rozkładem N(m, R) Natomiast w przypadku, gdy 
nie znamy rozkładu zmiennej X, a jedynie jej nadzieję matematyczną m i odchy- 
lenie standardowe o, ale wielkość próbki n jest duża, to z centralnego twierdzenia 
granicznego wynika, że Pr ma w przybliżeniu rozkład N(m, Ja) 


7.3 Estymatory nieobciążone i zgodne 


Jednym z zadań statystyki jest znajdowanie estymatorów (a więc statystyk), które 
w jakimś sensie mówią nam o rozkładzie Px zmiennej losowej X, z której pochodzi 
dana próbka. Na przykład, wydaje się, że znajomość średniej arytmetycznej: 

Xi +... + Xn 


gaa nan 
n 
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daje nam pewne informacje o nadziei matematycznej E(X). Zauważmy jednak, że 
istnieją inne estymatory, które także dają pewne informacje o wartości średniej — 
przykładowo: 


u £ 
T (tias in) = Tı + Tn 
2 
lub 
I (Gi ydy) = mini<i<n tti) + MaX <i<n {ti} 


2 
Oczywiście, można wskazać jeszcze inne, dość „rozsądne” estymatory nadziei mate- 
matycznej. 

Powstaje więc problem, jaki estymator należy stosować w konkretnej sytuacji. 
Rozwiązuje się go w ten sposób, że wprowadza się kilka kryteriów, które powinien 
spełniać „dobry” estymator, a następnie bada się, czy rozpatrywany przez nas esty- 
mator spełnia te kryteria. Istnieją też sposoby porównywania między sobą estyma- 
torów tego samego parametru. 

W dalszej części podajemy dwa kryteria oceny jakości estymatorów parametrów 
liczbowych. 


7.6 DEFINICJA 
Niech X1,..., X, będzie próbką prostą ze zmiennej losowej X oraz niech 
P = {P} : 0 € O} będzie rodziną rozkładów, przy czym © C R. Estymator 
T(X1,..., Xn) nazywamy estymatorem nieobciążonym parametru 0 € ©, 
jeżeli: 


E(T(X1,..., Xn)) = 8. 
Estymator, który nie jest nieobciążony nazywamy estymatorem obciążo- 


nym. 


7.7 PRZYKŁAD 
Srednia arytmetyczna jest estymatorem nieobciążonym nadziei matematycznej E(X). 
Rzeczywiście, stosując podstawowe własności nadziei matematycznej otrzymujemy: 


KAX id AE. i 
E(Ż,) = ( 1 =) = LE(% F F Xa) = „nE(X) = E(X). 
7.8 PRZYKŁAD 


n 
Niech m = E(X) oraz niech s? będzie statystyką określoną wzorem: 


n 


8°(£1,..., En) = — > (c s)": 


i=1 
Wówczas estymator odpowiadający statystyce s? jest nieobciążonym estymatorem 


wariancji D?(X). Rzeczywiście: 


E(s*(X1, kac PD =E (, (X — m) = D E((X; = m)?) 
i=1 i 


= —nD*(X) = D*(X). 


n 


7.9 PRZYKŁAD 
W przypadku, gdy nie znamy nadziei matematycznej m, możemy także estymować 


wariancję — definiujemy wtedy s? następująco: 

n 

DRE — z)”. 
i=1 


Okazuje się niestety, iż jest to estymator obciążony. Aby to wykazać, zauważmy 
najpierw, że ponieważ zmienne losowe X; — X mają takie same rozkłady, zatem: 


2 
E(s? (X1, ..., Xn)) = Ln E((Xı =X) | -E (Œ Xı + — tir) ) 


-e (3% rt | 
(Z " (X2 m) +...+ (Xn 0) | 


(tę ostatnią równość otrzymano dodając i odejmując liczbę zm). Po podniesieniu 
do kwadratu odpowiednich wyrażeń i wykorzystaniu następującego faktu, wynika- 
jącego z niezależności zmiennych losowych X; i X; (patrz twierdzenie 5.15): 


S|H 


8° (æ, Saa Tn) z 


= 


E((X; — m)(X; — m)) = E(X; — mjE(X; m) = 0-0 =0 dla i £ j, 


otrzymujemy: 


(8 (Xari Xn) = 5 ((n - PE — m)?) +E — m?) +... 


7.10 UWAGA 
Pomimo tego, iż zdefiniowany w poprzednim przykładzie  estymator 


s?(X1,..., Xn) jest obciążony, jest on często używany, gdyż dla dużej próbki: 


n-l 


= 1. 


n 


Inaczej mówiąc, obciążenie tego estymatora jest dla dużych n nieistotne. Estymatory 
o takiej własności nazywa się estymatorami asymptotycznie nieobciążonymi. 
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7.11 UWAGA 
Wynik uzyskany w przykładzie 1.9 można wykorzystać do konstrukcji nieobciążonego 
estymatora wariancji. Jest nim oczywiście: 


1 
n— 1 


n 
(Xi, ..., Xn) = a Xn. Xn) = 


Sx- KZ, 
1=1 


gdyż: 


MERCY E(s? (Xi, ..-, Xn)) EB(E) 


7.12 DEFINICJA 
Niech X1,..., Xn będzie próbką prostą ze zmiennej losowej X oraz niech 
P = {P} : 0 € O} będzie rodziną rozkładów, przy czym 0 C R. Estymator 
T(X1,..., Xn) nazywamy estymatorem zgodnym parametru 0 € O, jeżeli: 


T(X1,.-., Xn) = 0. 


7.13 PRZYKŁAD 
Średnia X jest estymatorem zgodnym nadziei matematycznej. 


7.4 Wartość największa funkcji 


Poznamy teraz chyba najpopularniejszą metodę estymacji punktowej — metodę naj- 
większej wiarygodności. Jednak aby ją poprawnie stosować, musimy przypomnieć 
sobie pewne wiadomości z analizy matematycznej. 

Przypuśćmy, że mamy daną funkcję f: K —— R, gdzie K C R jest ustalonym 
zbiorem. Mówimy, że funkcja ta przyjmuje wartość największą w punkcie ĉ € K, 
jeżeli: 

f(x) < f(ż) dla każdego z € K. 
Oczywiście, nie dla wszystkich funkcji daje się określić wartość największą, jednak 
przy pewnych dodatkowych założeniach można stwierdzić, że wartość taka istnieje. 
Mówi o tym poniższe twierdzenie, które przytaczamy bez dowodu. 


7.14 TWIERDZENIE 
Załóżmy, że funkcja f jest ciągła na zbiorze A oraz że zachodzi jeden z 
następujących warunków: 


1. A= |a,b] jest przedziałem domkniętym i ograniczonym, 


2. A jest dowolnym przedziałem (ograniczonym lub nieograniczonym) 
oraz istnieją granice funkcji f na końcach tego przedziału i są one 
skończone lub równe — o0. 


Wtedy funkcja f przyjmuje wartość największą w pewnym punkcie prze- 
działu A. 
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Z praktycznego punktu widzenia, zainteresowani jesteśmy wyznaczeniem punktu 
ĉ, w którym dana funkcja przyjmuje wartość największą. Bardzo ważnym narzę- 
dziem okazuje się być tutaj pochodna — oto, bardzo pomocne w tym przypadku, 
klasyczne twierdzenie z analizy matematycznej: 


7.15 TWIERDZENIE 
Jeżeli funkcja f:(a,b) — R jest różniczkowalna i przyjmuje wartość 
największą w punkcie ż € (a,b), to f'(ż) =0. 


Podkreślamy, że w obu powyższych twierdzeniach wszystkie założenia są istot- 
ne. Jeżeli w konkretnej sytuacji potrafimy stwierdzić, że są one spełnione, to nasz 
problem sprowadza się do obliczenia pochodnej i rozwiązania równania: 


f'(a) = 0. 


Wówczas funkcja f może osiągać wartość największą jedynie w punktach będących 
rozwiązaniami powyższego równania lub końcami przedziału określoności, o ile na- 
leżą one do tego przedziału. Bardzo często zdarza się, że nasze równanie ma do- 
kładnie jeden pierwiastek oraz że łatwo sprawdzić, iż wartość największa nie może 
być przyjęta na końcach przedziału określoności — w tym przypadku to właśnie owo 
rozwiązanie jest jedynym punktem, w którym funkcja przyjmuje wartość największą. 

W niektórych przypadkach funkcja f jest na tyle skomplikowana, że nie potrafi- 
my stwierdzić, czy zachodzą założenia twierdzeń 7.14i 7.15. Praktyczną metodą jest 
wtedy narysowanie wykresu (na przykład za pomocą komputera) i na zauważenie 
na jego podstawie, że taka wartość rzeczywiście istnieje. Innym problemem może 
być brak różniczkowalności lub skomplikowana postać pochodnej f'(x), uniemożli- 
wiająca analityczne rozwiązanie powyższego równania — należy wtedy zastosować 
odpowiednią metodę numeryczną. 

Podkreślamy, iż metoda największej wiarygodności, którą za chwilę przedstawi- 
my, jest zaimplementowana w większości komputerowych programów matematycz- 
nych i statystycznych. Na przykład, program Maple (w wersji 10) udostępnia ją 
w pakiecie: 


Statistics[MaximumLikelihoodEstimate|, 


zaś w programie Excel istnieje dodatek Solver, który można, między innymi, zasto- 
sować do optymalizacji funkcji. 


7.5 Estymacja metodą największej wiarygodności 


Omówimy tutaj jedną z najczęściej stosowanych metod estymacji punktowej — me- 
todę największej wiarygodności. Zaczniemy od (fikcyjnego) przykładu. 


7.16 PRZYKŁAD 

Spośród studentów informatyki pewnego elitarnego wydziału wybrano losowo i nie- 
zależnie od siebie 50 osób, a następnie każdą z nich spytano, czy kiedykolwiek w trak- 
cie studiów otrzymała ocenę niedostateczną. Okazało się, iż 14 osób odpowiedziało 
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„TAK”, natomiast pozostałe odpowiedziały „NIE”. Pytamy teraz: jaki procent stu- 
dentów informatyki otrzymał w trakcie swoich studiów ocenę niedostateczną. 

Mamy tutaj zaobserwowaną próbkę prostą £1,..., £n, n = 50, z rozkładu dwu- 
punktowego (0, 1, p): O interpretujemy jako „NIE”, zaś 1 — jako „DTAK”. Naszym za- 
daniem jest wskazanie parametru p. Oczywiście, nie potrafimy tego zrobić dokładnie 
na podstawie samej tylko próbki, natomiast możemy możliwie najlepiej przybliżyć 
jego nieznaną wartość w następujący sposób: obliczamy prawdopodobieństwo wy- 
losowania naszej próbki w zależności od p, a następnie uznajemy, że najlepszym 
przybliżeniem nieznanego parametru będzie taka wartość p, dla której obliczone 
właśnie prawdopodobieństwo jest największe. 

Przystąpmy zatem do realizacji opisanej powyżej procedury. Korzystając z nie- 
zależności zmiennych losowych X1,..., X, otrzymujemy: 


PX r= tinna ARE | EPIA EB) 90PIZ U): 


Zauważmy, że: 


PRE" p, gdyazz=l 
Pi 2) = | l-p, gdy zj =0. 


Z treści zadania wiemy, że x; = 1 dla dokładnie 14 wartości i . Tak więc: 
P(X = W1;::. „Xn = Tn) = p> “(I sp E a SĘ p“ — p)”. 


Pozostaje nam wyznaczyć największą wartość funkcji l: [0,1] — R, zadanej 
wzorem: 
ip) = p“ (1 = p)” 


oraz zwanej funkcją (największej) wiarygodności. Łatwo stwierdzić, że funkcja ta ma 
wartość największą, gdyż jest ciągła na przedziale domkniętym i ograniczonym (0, 1]. 
Co więcej, wartość ta musi być przyjęta w jakimś punkcie (lub punktach) 5 e (0,1), 
gdyż dla p = 0 oraz dla p = 1 wartości funkcji l są równe 0, i właśnie to Ĥ przybliża 
nieznaną wartość parametru p. 

W celu wyznaczenia p wykorzystamy powszechnie używaną metodę upraszcza- 
jącą obliczenia — rozważymy mianowicie funkcję: 


L(p) = ni(p), 


która przyjmuje wartość największą dokładnie w tych samych punktach, co funkcja 
l. Tak więc: 
L(p) = 14ln p + 361n(1 — p). 


Obliczamy: 
14 36 
L' (p) ANAL W Er zm zcżó) 
p 4l-p 
a następnie rozwiązujemy równanie L'(p) = 0, czyli: 
14 36 
p l-p ’ 


otrzymując następujące rozwiązanie: 


== 0.28 

„JC AA 
Otrzymany w ten sposób estymator nazywa się estymatorem największej wiarygod- 
ności parametru p. 


Metoda największej wiarygodności polega więc na skonstruowaniu funkcji wia- 
rygodności odpowiadającej zaobserwowanemu zdarzeniu, zależnej od szukanych (es- 
tymowanych) parametrów, a następnie na znalezieniu takich wartości tych para- 
metrów, dla których funkcja ta osiąga największą wartość. Podkreślamy jednak, że 
wartość funkcji największej wiarygodności nie musi być dokładnie równa prawdopo- 
dobieństwu zaobserwowanego zdarzenia — wystarczy, że będzie do niego proporcjo- 
nalna (patrz przykład 7.17). 


7.17 PRZYKŁAD 
Chcąc zbadać wadliwość nowej serii komputerów, przeprowadzono następujące ba- 
danie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich 
poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: w ciągu 14 
dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria 
jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie 2 kompute- 
rów. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopo- 
dobieństwo awarii w czasie jednego dnia pracy? 

Oznaczmy szukaną wadliwość komputera przez p i policzmy prawdopodobieństwo 
zaobserwowanego zdarzenia w zależności od p. W tym celu zauważmy najpierw, że 
prawdopodobieństwo zajścia dokładnie k awarii w ciągu jednego dnia wynosi: 


10 = 
a= (Hra -aet 


Ponieważ awarie zachodzą niezależnie od siebie, więc prawdopodobieństwo opisanego 
powyżej zdarzenia wyraża się wzorem: 


4 2 
atażaż = (a-p)o) (a Hi p”) io pa~ p) 


= 20250000 (1 — p)!’ p’. 


Jako funkcję wiarygodności warto więc przyjąć: 
(p) = (1 = p)'”?p*. 


Naszym zadaniem jest znalezienie takiego punktu Ĥ, w którym funkcja l osiąga 
wartość największą na przedziale [0,1]. Zauważmy, że taka wartość Ď istnieje i jest 
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liczbą z przedziału (0,1). Aby ją wyliczyć postępujemy dokładnie tak samo, jak 
poprzednio — definiujemy: 


L(p) = lnl(p) = 1921n(1 — p) + 8ln p, 


obliczamy pochodną: 
192 + 8 


l-p p 


a następnie rozwiązujemy równanie L'(p) = 0, otrzymując: 


, 


L'(p) = 


ô = 0.04. 


Do tej pory rozważaliśmy jedynie przykładowe sytuacje, w których miała zasto- 
sowanie metoda największej wiarygodności. Zajmijmy się więc teraz przypadkiem 
ogólnym. 

Jeżeli obserwujemy próbkę prostą 11,...,x, z rozkładu dyskretnego o parame- 
trze 0, to określamy funkcję wiarygodności jako: 


1(8) = cPg(21) ORK Be(Tx): 


gdzie c jest stałą dodatnią, zaś estymatorem największej wiarygodności parametru 
0 nazywamy taką wartość 0 € ©, że dla każdego 0 € © zachodzi warunek: 


1(6) < 1(6). 


W przypadku rozkładów ciągłych prawdopodobieństwo zaobserwowania poje- 
dynczej próbki prostej 11,...,x, jest równe 0, jednak i w tym przypadku można 
stosować metodę największej wiarygodności — tym celu definiuje się funkcję wiary- 
godności: 


1(6) =cfo(11):...* fo(Tn), 
gdzie f jest gęstością rozkładu Py, zaś c > O jest stałą. 


7.18 PRZYKŁAD 
Rozważmy próbkę prostą z rozkładu wykładniczego o parametrze A > 0. Znajdziemy 
estymator największej wiarygodności dla tego parametru. 


Pamiętamy z rozdziału 6, że gęstością rozkładu wykładniczego jest funkcja: 
0 dlaz<0 
Ie) = l Xe" dla z> o0. 
Ponieważ próbka z,,...,a«, pochodzi z tego rozkładu, więc można założyć, że: 


xi >0 dla każdego i. 
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Zatem funkcja wiarygodności ma w tym przypadku postać: 
(X) = Je "1 Pizie Je An = NAAN 4 Zi = Xe Anż 


(tutaj nz > O jest znaną liczbą). Jak widać, funkcja / ma w punkcie 0 wartość równą 
0, a także można łatwo stwierdzić, że 
lim IX) =0. 
A—0% 
Jest oczywiste, że l jest funkcją ciągłą, przyjmującą wartości dodatnie dla wszyst- 


kich A > 0. Tak więc istnieje punkt A > 0, w którym funkcja l przyjmuje wartość 
największą. Aby go wyznaczyć, wygodnie jest rozważyć funkcję: 


L(A) =lni(X) = nln à — Anz. 


Teraz różniczkujemy: 
n 


i widzimy, że pochodna L’ przyjmuje wartość zero w punkcie: 


który jest właśnie szukanym estymatorem parametru A. 


7.6  Estymatory największej wiarygodności — własności 


Poznaliśmy ogólne zasady konstrukcji estymatorów metodą największej wiarygodno- 
ści. Jednak uważny student zwrócił z pewnością uwagę, że w niektórych przypadkach 
można było z góry przewidzieć wynik. Czy musieliśmy więc używać wówczas meto- 
dy? Oczywiście nie — metodę największej wiarygodności stosuje się, przede wszyst- 
kim, w sytuacjach, w których nie widać od razu rozsądnego estymatora (w trakcie 
ćwiczeń omówimy takie sytuacje). Jednakże warto zwrócić uwagę na to, że estyma- 
tory największej wiarygodności posiadają pewne uniwersalne własności, co sprawia, 
że są one na ogół „dobrymi” estymatorami. Poniżej przytaczamy niektóre z tych 
własności. Pamiętajmy jednak, iż, aby one zachodziły, należy przyjąć pewne dość 
techniczne założenia, które na ogół są spełnione. 


(1) Estymator największej wiarygodności jest zgodny. 
(2) Estymator największej wiarygodności jest asymptotycznie nieobciążony. 


(3) W przypadku dużych próbek, estymator największej wiarygodności parametru 
0 ma w przybliżeniu rozkład N(6, z): gdzie I, jest tak zwaną informacją 
Fishera, którą można określić dla niemal każdego rozkładu dyskretnego lub 
ciągłego (nie robimy tego jednak tutaj). 
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(4) Jeżeli 6 jest estymatorem największej wiarygodności parametru 0, zaś g: O — 


R — funkcją ciągłą, to g(0) jest estymatorem największej wiarygodności para- 
metru g(0). 


Metodę największej wiarygodności stosuje się także w sytuacji, gdy szukany pa- 
rametr jest wektorem, na przykład 6 = (m,o) w rozkładzie N(m,o). Należy wówczas 
wyznaczyć wartość największą funkcji wielu zmiennych, co jednak często okazuje się 
być zadaniem niezbyt łatwym. 


7.7 Estymacja przedziałowa 


Estymacja punktowa omówiona poprzednio nie daje odpowiedzi na pytanie, jak pew- 
ny jest otrzymany wynik estymacji, czyli jak dokładnie przybliża on prawdziwą war- 
tość estymatora. Niedogodność tę można częściowo pokonać, wyznaczając tak zwane 
przedziały ufności dla określonych parametrów, które definiujemy następująco: 


7.19 DEFINICJA 
Niech a € (0,1) będzie ustaloną liczbą (zwykle a jest równe 0.01, 0.05 
lub 0.1). Przedział A = CRG Xn c R, zależny od próbki losowej 
Xı,..., Xp, nazywamy przedziałem ufności parametru 0 € T na poziomie 
ufności a, jeżeli: 
P(0 € A)=1-a. 


7.20 PRZYKŁAD 
Kontrolując pewną hurtownię zważono 10 torebek cukru, otrzymując następujące 
wyniki (w gramach): 


1002, 1003, 997, 997, 994, 995, 998, 997, 1003, 999. 


Jaka jest średnia waga torebki cukru w tej hurtowni? 
Zakładając, że waga torebki cukru ma rozkład normalny, można na przykład 
użyć metody największej wiarygodności i obliczyć estymator: 


110 = 998.5. 
Jednak nas interesuje coś więcej — od czego jest mniejsza średnia waga torebki cukru, 


przy czym nie musimy (i nie potrafimy) mieć absolutnie pewnego wyniku. Mówiąc 
inaczej, szukamy liczby b takiej, że: 


gdzie m oznacza nadzieję matematyczną wagi torebki cukru w hurtowni. 
Przed przystąpieniem do rozwiązywania naszego zadania, ujawnijmy wynik: 


b = 999.716. 
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(wynik ten otrzymano przy założeniu, że dokładność wagi wynosi 3 g). Używając 
języka potocznego możemy więc powiedzieć, że mamy 90% pewności, że średnia waga 
torebki cukru jest mniejsza niż 999.716 g. Przedział: 


(—00,999.716) 


nazywamy 90% przedziałem ufności dla nadziei matematycznej. Oczywiście, można 
mówić także o 95%, 99% oraz innych przedziałach ufności. W naszym przypadku 95% 
przedział ufności to (—oo, 1000.060), zaś 99% przedział ufności to (—oo, 1000.707). 
Tak więc nie możemy już twierdzić, że na 95%, ani tym bardziej na 99%, waga jednej 
torebki cukru jest mniejsza od 1 kg. 


Przedstawimy teraz rozwiązanie problemu, który jest oczywistym uogólnieniem 
powyższego przykładu, uzyskując, jako wyniki szczególne, przytoczone powyżej roz- 
wiązania. 

Załóżmy, że dana jest próbka prosta £1, ..., £n z rozkładu N(m,o), przy czym za- 
kładamy najpierw, że znamy odchylenie standardowe o (w przypadku ważenia cukru 
może ono odpowiadać znanej dokładności wagi, którą dysponujemy). Dla ustalonej 
liczby a € (0,1) szukamy takiej liczby b, że: 


P(m<b=l-a. 


Ponieważ (patrz twierdzenie 6.9) estymator: 


Teraz, z jednej strony: 


zaś z drugiej strony: 


Mamy więc: 


p (= tyn) = a 


!Równie dobrze można było pisać a zamiast 1 — a; my jednak postępujemy zgodnie z tradycją. 
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i stąd: 


co daje wynik: 
= -l(a — 5 1(1-a 
R CIE R EG 
yn yn 
Wracając do przykładu 7.20 — w tym przypadku n = 10 oraz o = 3 (dokładność 
wagi). Ponieważ obserwujemy próbkę, więc w powyższym wzorze w miejsce esty- 
matora średniej podstawiamy wartość odpowiadającej mu statystyki (obliczonej na 
podstawie tej próbki), czyli: 


X10 = Z10 = 998.5. 


Teraz przyjmując za a kolejno liczby 0.1, 0.05 oraz 0.01, otrzymamy ujawnione 
wcześniej wartości b. 

Opisane powyżej zagadnienie można modyfikować na różne sposoby. Po pierw- 
sze, może nas interesować przedział ufności innego typu, na przykład postaci (a, 00) 
lub (Zn — €, Zn + £). Po drugie, nie zawsze można założyć, że znamy odchylenie stan- 
dardowe o. Po trzecie, założenie, że rozkład jest normalny, często nie jest spełnione. 
Możemy także być zainteresowani znalezieniem przedziału ufności dla innego, niż 
nadzieja matematyczna, parametru rozkładu. 

Istnieją różne metody radzenia sobie w wymienionych przypadkach, ale większość 
z nich polega na zastosowaniu podobnego do poprzedniego schematu postępowania, 
który polega on na wykorzystaniu pewnej zmiennej losowej o znanym rozkładzie, bę- 
dącej funkcją estymatora interesującego nas parametru, a następnie na obliczeniu na 
jej podstawie (oraz na podstawie zaobserwowanej próbki) końców przedziału ufności 
na określonym z góry poziomie ufności 1 — a. W naszych wcześniejszych rozważa- 
niach tą zmienną losową była zmienna Z, zaś jej rozkład był znany na podstawie 
twierdzenia 6.9, przy czym uwzględniliśmy założoną wcześniej znajomość o. Poniżej 
opiszemy dwie sytuacje, w których kolejny raz zastosujemy opisany właśnie sposób 
postępowania. 

Zakładamy najpierw, że obserwujemy próbkę prostą 11,...,1n z pewnego nie- 
znanego rozkładu, przy czym n jest dużą liczbą (już dla n > 30 poniższe rozumowa- 
nie prowadzi do dobrych rezultatów). Na podstawie tej próbki chcemy wyznaczyć 
100(1 — a)% przedział ufności dla nadziei matematycznej m tego rozkładu, postaci: 


(in — €, in + €). 


Aby rozwiązać powyższe zadanie wykorzystamy pewną modyfikację zmiennej 
losowej: 


> 
Ze rZE fn, 
[oj 


Po pierwsze, na podstawie centralnego twierdzenia granicznego (oraz tego, że n 
jest duże) możemy założyć, że zmienna ta ma rozkład N(0,1). Nie możemy jednak 
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bezpośrednio jej wykorzystać, tak jak to zrobiliśmy poprzednio, gdyż tym razem nie 
założyliśmy znajomości parametru o. Problem ten pokonujemy wykorzystując to, że 
dla dużych n liczba: 


s: L Y(a; — En)? 


1=1 


dobrze przybliża o (dlaczego?). Rozważamy więc zmienną losową: 


W, = —— VM, 


o której można założyć, że ma rozkład N(0, 1), a której wartość może być już te- 
raz wyliczona na podstawie samej tylko próbki x1,...,%n. Naszym zadaniem jest 
znalezienie takiego £, że: 


P(m € (X, — €,X, +€))=1—a. 


Przekształcamy więc kolejno: 


P(m € (X —€, Xn +e))=P(|X,—m|<e)=P (I < yn) 


-+(5a)-o(-0)-2(2A)-1 


Stąd: 
p (Eva) =]— za 
S 2 
czyli: 
Ra = gl ( = z) 
S 2 
i wreszcie: 


e= 48" (1-5). 


Wiem zatem, że z prawdopodobieństwem 1 — a wartość parametru m znajduje się 


w przedziale: 
s a 8 a 
E EE 
(z yn ( z) ty 2 


Nasuwa się teraz pytanie o to, jak postępować gdy próbka z,,...,a«, jest mała, 
a (tak jak poprzednio) chcemy wyznaczyć 100(1 — a)% przedział ufności dla nadziei 
matematycznej m rozkładu, z którego ona pochodzi. Niestety, w przypadku gdy nie 
znamy charakteru tego rozkładu, zadanie to jest niewykonalne przy użyciu naszej 
metody ?. 


2Można wtedy stosować metodę bootstrap, o której będzie mowa w rozdziale 8. 
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Załóżmy więc dodatkowo, że próbka pochodzi z rozkładu N(m,o) o nieznanym 
odchyleniu standardowym. Zmienną losową, którą tutaj wykorzystamy, jest: 


EM ; 1 > 
t= vn, gdzie s = =. 20% — X)”. (7.1) 


Okazuje się, że zmienna ta ma tak zwany rozkład Studenta, nazywany czasem także 
rozkładem t. Rozkład ten posiada jeden parametr n, który określa się jako liczbę 
stopni swobody. Nie podajemy tutaj dość skomplikowanego wzoru na gęstość tego 
rozkładu - praktycznie wszystkie standardowe programy komputerowe posiadające 
odpowiednie pakiety funkcji statystycznych (a więc, między innymi, programy Maple 
i Excel), podają wartości dystrybuanty 74, (x) oraz kwantyli F7! (a) dla wszystkich 
wartości n, gdzie tn oznacza rozkład Studenta o n stopniach swobody. Rozkład 
Studenta, podobnie jak rozkład N(0, 1), jest symetryczny, zatem: 


F; (—x) = 1 — F, (x) dla każdego z € R, 


co znakomicie ułatwia korzystanie z tablic. Co więcej, dystrybuanta F}„ zmierza do 
dystrybuanty standardowego rozkładu normalnego, czyli dla każdego z € R: 


Fin (£) — (2), gdy n— o. 


Okazuje się, że już dla n = 20 wynikające z powyższej zbieżności przybliżenie jest 
całkiem dobre. 
Kluczowym dla naszych dalszych rozważań jest następujące: 


7.21 TWIERDZENIE 
Dla próbki prostej X1,..., Xn pochodzącej z rozkładu N(m,o), estyma- 
tor t, określony wzorem (7.1), ma rozkład Studenta o n — 1 stopniach 
swobody. Inaczej: 


P(t < z) =F,_,(x1) dla każdego z € R. 


Dzięki temu, że rozkład Studenta jest symetryczny można, tak jak poprzednio, 
wyprowadzić wzory na przedziały ufności typu (—00,b), (a, o0) oraz (Zn — €, Ty + £). 
Proponujemy Czytelnikowi aby sprawdził, że przedziałami tymi odpowiednio są: 


(- X 4 O (7.2) 
OO, Xn + 8 VE ; ; 


( RE BA 1 4 a) 

Xn — s — = „oo|, (7.3) 
EE ZERA) 

( n yn An rS yn | , (7.4) 
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gdzie, zgodnie z naszymi oznaczeniami, Fz! (u) oznacza kwantyl rzędu u w rozkła- 
dzie £ o n — 1 stopniach swobody. 

Powyższe wzory stosuje się zazwyczaj, gdy próbka jest mała, to znaczy gdy 
n < 30. Faktycznie, dla n > 20 rozkład tn niewiele różni się od rozkładu N(0, 1), 
a wraz ze wzrostem n różnica ta jest coraz mniejsza. Tak więc, zadane wzorami 
(7.2), (7.3) i (7.4) przedziały ufności są praktycznie takie same jak te wcześniejsze, 
wyznaczone w oparciu o centralne twierdzenie graniczne. 


Można także wyprowadzić wzory na przedziały ufności dla pozostałych parame- 
trów, przyjmując zarówno takie same, jak i inne niż poprzednio założenia o charak- 
terze rozkładu. Tutaj jednak ograniczymy się tylko do jednego, ale bardzo ważnego 
przypadku. 

Załóżmy, że próbka prosta x,,... ,«, pochodzi z rozkładu dwupunktowego (0, 1, p) 
i że na jej podstawie chcemy wyznaczyć przedział ufności dla parametru p. W przy- 
padku, gdy liczność próbki jest mała (n < 30), wzory takie są dość skomplikowane. 
Natomiast, gdy wielkość próbki jest duża, można wykorzystać to, że nadzieja mate- 
matyczna zmiennej losowej, z której pochodzi dana próbka, wynosi p, natomiast jej 
wariancja jest równa p(1— p). Stosując podobne rozumowanie jak poprzednio można 
otrzymać następujące wzory na (1 — a)100% przedziały ufności dla p: 


-Ao (1-5 „pa BU_Bz- (-5)). 


gdzie: 
A k 
p = Tn = RW) 
n 
zaś k oznacza liczbę jedynek (czyli liczbę „sukcesów” ) w próbce 141,...,Tn. 


Na zakończenie tego punktu zwróćmy uwagę na to, że przedziały ufności dla 
niektórych parametrów mogą być także wyznaczane przy pomocy programów typu 
Maple lub Excel. 


7.8 Testowanie hipotez 


Często zdarzają się sytuacje, w których, na podstawie posiadanych obserwacji, po- 
winniśmy podjąć określone decyzje. Pomocą może nam służyć tutaj teoria testowania 
hipotez statystycznych. W naszym kursie ograniczamy się jedynie do najprostszych 
przypadków testów parametrycznych, a nasz sposób podejścia opiera się na wyzna- 
czaniu tak zwanej wartości-p (ang. p-value) — metodzie, która stała się popularna 
dopiero po upowszechnieniu się komputerów. Oczywiście, omówimy także podejście 
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tradycyjne — więcej na ten temat można przeczytać praktycznie we wszystkich pod- 
ręcznikach, które zawierają elementy statystyki. 

Jak zwykle, zaczniemy od przykładu. Powróćmy do zagadnienia oceny średniej 
wagi torebki cukru w pewnej hurtowni (patrz przykład 7.20) i postawmy nasz pro- 
blem trochę inaczej. Zapytajmy mianowicie, czy prawdą jest, że średnia waga torebki 
cukru w tej hurtowni wynosi 1 kg, czy może jednak jest mniejsza od 1 kg? 

Formalnie rzecz ujmując, stawiamy tutaj dwie hipotezy: tak zwaną hipotezę ze- 
rową, oznaczaną zwykle jako Hg, oraz hipotezę alternatywną, oznaczaną jako Hı. 
W naszym przypadku: 


Hg:m = 1000, Hı:m < 1000, 


gdzie m jest średnią wagą torebki. Aby rozstrzygnąć zadany problem, musimy dyspo- 
nować statystyką testową, powiedzmy T, która przy założeniu prawdziwości hipotezy 
Hyo posiada następujące własności: 


(1) znany jest rozkład T, 
(2) można obliczyć wartość T dla danej próbki prostej, 
(3) jej zachowanie wyraźnie wskazuje na zachodzenie Hy lub H4. 


Następnie dla zaobserwowanej próbki prostej 1,,..., £n liczymy tak zwaną wartość-p 
(p-value), to znaczy: 
P(T(a1, SR En) € K), 


przy czym K jest tak dobrane, że: 
(1) K najlepiej świadczy na korzyść Hi, 


(2) T(a1,...,zn) € K. 


7.22 PRZYKŁAD 
Rozważmy następujące wyniki (te same co w przykładzie 7.20) ważenia 10 torebek 
cukru (w gramach): 


1002, 1003, 997, 997, 994, 995, 998, 997, 1003, 999. 


Załóżmy, że jest to próbka prosta z rozkładu N(m,o) o znanym odchyleniu stan- 
dardowym o = 3. Jako statystykę testową bierzemy: 


która, jak wiemy, posiada rozkład N(0, 1). Z przykładu 7.20 pamiętamy, że 149 = 
998.5, łatwo więc obliczyć wartość powyższej statystyki dla naszej próbki danych: 


z= 983- 00 yig x —1.581. 
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Teraz zakładamy hipotezę Hg, czyli że m = 1000. Zauważmy, iż ujemne wartości 
Z, sugerują, że wartość średnia jest raczej mniejsza niż 1000, tak więc największym 
zbiorem świadczącym na korzyść H; i jednocześnie zawierającym obliczoną wcześniej 
wartość statystyki Z,, jest przedział: 


K = (—œ, z| ~ (—00, —1.581], 
zatem wartość-p wynosi: 
P(Z, € K) z $(—1.581) = 0.057. 


Nietrudno zauważyć, że otrzymana powyżej wartość jest prawdopodobieństwem 
tego, że, przy założeniu prawdziwości hipotezy zerowej, zachodzi zaobserwowane 
przez nas zdarzenie lub inne zdarzenie, które jeszcze bardziej świadczy na korzyść 
hipotezy alternatywnej. Inaczej mówiąc, jeżeli średnia waga torebki cukru rzeczywi- 
ście wynosiłaby 1 kg, to szansa na to, że 10 (wylosowanych zupełnie przypadkowo) 
torebek będzie miało zadane wagi, jest mniejsza niż 5.7%. Podejmując teraz decyzję 
co do prawdziwości hipotezy zerowej mamy następującą wskazówkę: jeżeli odrzucimy 
Ho na korzyść Hı, to prawdopodobieństwo tego, że decyzja ta jest błędna, wynosi 
około 5.7%. 

Dla jeszcze lepszego zrozumienia przeprowadzonego powyżej rozumowania, roz- 
ważmy dwa inne zestawy danych oraz obliczone na ich podstawie wartości-p. Dla 
próbki: 

999, 1004, 1001, 994, 997, 999, 1002, 1001, 999, 1000, 


mamy: 
T10 = 999.6, z ~ —0.422 oraz wartość-p x 0.337, 


natomiast dla próbki: 
999, 996, 1001, 996, 996, 996, 1002, 990, 995, 1000, 
otrzymujemy: 
©1o = 997.1, z © —3.057 oraz wartość-p = 0.001. 


W pierwszym przypadku, odrzucając hipotezę zerową, z dość dużym prawdopodo- 
bieństwem narazilibyśmy się na popełnienie błędu, zaś w drugim przypadku popeł- 
nienie takiego błądu jest niezwykle mało prawdopodobne. 


W powyższym przykładzie nie powiedzieliśmy, kiedy należy odrzucić hipotezę 
zerową, bowiem jest to decyzja „poza matematyczna”. Dlatego też wskazaliśmy je- 
dynie, jak określić prawdopodobieństwo błędu, z jakim należy się liczyć odrzucając 
prawdziwą hipotezę zerową — błąd ten jest nazywany błędem pierwszego rodza- 
ju. Rozważa się też tak zwany błąd drugiego rodzaju, polegający na nieodrzuceniu 
fałszywej hipotezy zerowej. Jednak, w większości przypadków, policzenie prawdopo- 
dobieństwa tego błędu nie jest możliwe, a poza tym istnieje przekonanie, że jest on 
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mniej istotny niż błąd pierwszego rodzaju, co w konsekwencji sprawia, iż hipoteza 
zerowa jest w pewnym sensie uprzywilejowana. 


Spójrzmy teraz ogólnie na nasze dotychczasowe rozważania. Na podstawie próbki 
prostej £1,..., £n chcemy przetestować hipotezę zerową: 


Ho: 08 = 80, 


względem hipotezy alternatywnej H1, przy czym Hı może być tak zwaną hipotezą 
jednostronną: 
H1:0 Z 60 lub H,:0 > 80, 


albo hipotezą dwustronną: 
Hi: 0 ca 80. 


W klasycznym podejściu do problemu testowania hipotez wykonujemy następu- 
jące kroki: 


(1) ustalamy zawsze tak zwany poziom istotności a — jest to zwykle mała liczba 
dodatnia, np. a = 0.01, a = 0.05 lub a=0.1, 


(2) wybieramy statystykę testową T o znanym rozkładzie, 
(3) wybieramy zbiór K, zwany zbiorem krytycznym, taki że: 
P(T(X1,..., Xn) EK)= 0, 


zaś warunek: 
T(0Q,...,Xn)EK 


wskazuje na prawdziwość hipotezy Hy, 


— 
A 
— 


obliczamy T(21,...,Tn), czyli wartość statystyki T na zaobserwowanej próbce, 


— 
(Si 
— 


jeżeli: 
T(z1,..., £n) É K, 


to stwierdzamy, iż nie ma podstaw do odrzucenia hipotezy Ho, natomiast jeżeli: 
T(z, Sas SEn) EK, 
to odrzucamy hipotezę Hg na korzyść hipotezy Hı. 


Jaki widać, z technicznego punktu widzenia najistotniejszą sprawą jest wyzna- 
czenie zbioru krytycznego K, który na ogół jest przedziałem, przy czym dla jedno- 
stronnych hipotez alternatywnych: 


K = (—œ,a] lub K = [b,oo), 


zaś dla hipotez dwustronnych: 


Tak więc wyznaczenie zbioru K redukuje się do wyznaczenia pewnych kwantyli 
rozkładu statystyki T. Kwantyle typowych rzędów dla wielu używanych w praktyce 
rozkładów są od lat stablicowane, dlatego też opisane powyżej podejście klasyczne 
mogło być (i było) stosowane od dawna. 

Z kolei w podejściu opartym na obliczaniu wartości-p, zamiast kroków (3) i (5) 
wykonujemy następujące: 


(3) obliczamy wartość-p dla T(11,...,1Xn), co (zgodnie z poprzednim określeniem) 
oznacza, że: 
P(T(a1, . ae En) € K), 


przy czym K jest tak dobrane, że K najlepiej świadczy na korzyść Hı oraz 
T (tiser ir) EK, 


(5°) jeżeli: 
wartość-p > a, 


to stwierdzamy, iż nie ma podstaw do odrzucenia hipotezy Hg, natomiast jeżeli: 
wartość-p < a, 
to odrzucamy hipotezę Ho na korzyść hipotezy Hı. 


Zauważmy zatem, że podejście oparte na obliczaniu wartości-p może być istot- 
nie trudniejsze, jednakże obecnie, kiedy dysponujemy komputerami z odpowiednim 
oprogramowaniem, nie nastręcza ono większych problemów i dlatego też podejście 
to zyskuje sobie ostatnio coraz więcej zwolenników, gdyż z metodologicznego punktu 
widzenia jest ono równoważne podejściu klasycznemu, a zarazem istotnie od niego 
prostsze. 

Wracając do przykładu 7.22, ustalmy poziom istotności a = 0.05. W dwóch 
pierwszych przypadkach nie ma podstaw do odrzucenia hipotezy Hg, natomiast 
w trzecim — hipoteza Hg powinna zostać odrzucona na korzyść hipotezy H1. Gdyby- 
śmy ustalili a = 0.1, to również w drugim przypadku należałoby odrzucić hipotezę 
Ho. 

Jak już wcześniej wspominaliśmy, dla skutecznego przeprowadzenia testu staty- 
stycznego wymagane jest dysponowanie odpowiednią statystyką o znanym rozkła- 
dzie. Okazuje się, iż nie zawsze jest to możliwe — gdyby, na przykład, liczebność 
próbki była zbyt mała, zaś rozkład z którego ona pochodzi nie byłby rozkładem 
normalnym, sprawa nie wyglądałaby zbyt obiecująco. Podobne problemy z doborem 
odpowiedniej statystyki o znanym rozkładzie powstają także wtedy, gdy chcemy 
testować hipotezy o innych (niż wartość oczekiwana) parametrach. Z drugiej stro- 
ny, wiele szczegółowych sytuacji zostało dokładnie „rozpracowanych” — znaleziono 
pożyteczne statystyki i ich rozkłady, a w ostatnich latach niezbędne obliczenia nu- 
meryczne zostały zaimplementowane jako funkcje z pakietów statystycznych wielu 
programów komputerowych (w szczególności, program Maple posiada szereg wbu- 
dowanych testów statystycznych). 
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Jak pamiętamy, najistotniejszym wynikiem testu statystycznego jest wartość-p: 
mała wskazuje na Hy, zaś duża — na Hg. Uważny Czytelnik przypuszczalnie za- 
uważył, że istnieje związek pomiędzy procedurą wyznaczania przedziałów ufności, 
a procedurą testowania hipotez. Tak rzeczywiście w wielu przypadkach jest — dlate- 
go też programy Maple i Excel, przeprowadzając testy statystyczne wyliczają przy 
okazji przedziały ufności. 


7.9 Test y? dopasowania rozkładu 


Do testów parametrycznych sprowadza się także niektóre inne problemy statystyczne 
— można, na przykład, testować hipotezę, że próbka prosta pochodzi z rozkładu 
normalnego, istnieją też testy dotyczące niezależności zmiennych losowych, losowości 
próbki oraz wielu innych zagadnień. Opiszemy poniżej jeden z takich testów, znany 
jako test x? dopasowania rozkładu (faktycznie pod tą nazwą kryją się dwa, różniące 
się nieco, problemy). 


Równość rozkładów 

Obserwujemy próbkę prostą 11,...,qTq ze zmiennej losowej X i stawiamy hipotezę: 
Ho: Px =Q, 

przeciw hipotezie alternatywnej: 


Ho: Px £ Q, 


gdzie Q jest pewnym ustalonym rozkładem. 

Formalnie rzecz biorąc, zagadnienie to różni się istotnie od poprzednio oma- 
wianych przykładów wnioskowania parametrycznego, niemniej, godząc się na utratę 
części informacji, można przeprowadzić opisany poniżej test. 

Najpierw tworzymy z naszej próbki szereg rozdzielczy, czyli ustalamy takie liczby 
ao <... < ak, ŻE: 


ao S min{z1,..., Zn}, ak > MAaX{T1,..., En}, 
a następnie zliczamy elementy próbki w poszczególnych klasach, otrzymując: 
ni = #{x£;: M E (ai-1,đi]} dla i = 1,...,k. 
Teraz obliczamy „teoretyczne” prawdopodobieństwa poszczególnych klas: 
Ti = Q((ai-1,a;]) dla i = 1,...,k. 


Jeżeli hipoteza zerowa jest prawdziwa, to należy oczekiwać, iż wielkości n; będą 
bardzo bliskie iloczynom nm; — jest to z kolei równoważne temu, że wielkość określona 
jako: 

2 


gas GEE 


NTi 


1=1 
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jest bliska zeru. 

Zauważmy, że zdefiniowana powyżej wielkość zależy od próbki, a więc jest zmien- 
ną losową. Co więcej, znamy rozkład tej zmiennej — jest to tak zwany rozkład X? 
o k— 1 stopniach swobody. Rozkład ten jest dobrze znany — został on stablicowany 
w wielu podręcznikach, jest także obecny (praktycznie we wszystkich) programach 
komputerowych, zawierających odpowiednie pakiety statystyczne. 

Tak więc w naszym przypadku: 


wartość-p = P(x > xo) = 1- Fe_ (xo), 


gdzie Xo jest obliczoną dla danej próbki wartością statystyki X, natomiast zbiór 
krytyczny ma postać: 
K = |k, œ), 


przy czym dla danego poziomu istotności a, liczba k jest kwantylem rzędu 1 — a 
rozkładu X? o k — 1 stopniach swobody, czyli: 
k= FZ (1- a). 


k—1 


Przynależność do rodziny rozkładów 


Obserwujemy próbkę prostą z1,..., £n ze zmiennej losowej X i stawiamy hipotezę: 
Ho: Px EP, 

przeciw hipotezie alternatywnej: 
Ho: Px £ P, 


gdzie P jest pewną ustaloną rodziną rozkładów. 

O ile wiemy, że rodzina rozkładów P zależy od skończonej liczby parametrów, 
powiedzmy Aq,...,A,, to powyższy problem sprowadza się w następujący sposób 
do poprzedniego: na podstawie danej próbki wyznaczamy metodą największej wia- 
rygodności estymatory Xi; kutą Xr parametrów A1, ..., Àr, a następnie rozważamy 
rozkład Q € P odpowiadający wyestymowanym wartościom parametrów Xi, AF 
i stosujemy dla niego opisaną powyżej procedurę, pamiętając jednak, że teraz należy 
użyć rozkładu X? o k — r — 1 stopniach swobody. 


7.10 Regresja 


Jednym z podstawowych narzędzi statystycznych jest tak zwana regresja. Zacznie- 
my od przykładu. Przypuśćmy, że chcemy zbadać zależność wydatków przeciętnej 
rodziny na zakup prasy w zależności od dochodów i od wielkości tej rodziny. Przy- 
puśćmy, że w tym celu przeprowadzono badanie 10 losowo wybranych rodzin. Oto 
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fikcyjne wyniki takiego badania. 


850 4 33 
1100 3 34 
1250 2 27 
1460 4 36 
3670 5 60 
4050 1 54 
4820 3 65 
5050 3 67 
6620 5 96 
8500 4 128 


W pierwszej kolumnie podano miesięczny przychód rodziny w złotych, w drugiej 
liczbę członków rodziny, a w trzeciej wydatki na zakup prasy w ostatnim miesiącu. 

Tabelka ta potwierdza nasze wcześniejsze przypuszczenia, że wydatki na prasę 
zależą od dochodu, ale może też od wielkości rodziny. Będziemy więc chcieli znaleźć 
efektywną zależność tych wielkości od siebie. Założymy więc, że istnieje jakaś zależ- 
ność wielkości wydatków na prasę, powiedzmy y, od dochodu rodziny, powiedzmy 
«1, oraz wielkości rodziny, 12. Moglibyśmy więc przyjąć, że istnieje taka funkcja y, że 
y=yp(x1,12). Jednak takie założenie jest praktycznie z różnych względów nierealne. 
Lepiej jest założyć, że y = f (x1, £2)+ £, gdzie f będzie miała stosunkowo prostą po- 
stać, natomiast e reprezentuje nieuniknione zaburzenie losowe. Teraz naszym celem 
będzie: (1) znalezienie funkcji f, (2) ocenienie wielkości zaburzenia losowego e oraz 
(3) ocena jakości całego modelu. Aby zrealizować (1) założymy kształt funkcji f. 
Powinien on być w miarę prosty i zgodny z naszą dotychczasową wiedzą i intuicją. 
Zawsze warto założyć kilka różnych scenariuszy. W naszym przypadku rozpatrzymy 
trzy dość naturalne modele. 


A: y=a+bzrı +E. 


B: y= a+ bzi + cz + E€. 
C: y=a+b> +e. 


Model A jest najprostszy, ale nie uwzględnia zależności wydatków na prasę od 
wielkości rodziny. B oraz C uwzględniają tę zależność, jednak w C zakładamy, że 
wydatki na prasę zależą od wielkości zarobków przypadających na jednego członka 
rodziny. 

Do zbudowania i oceny każdego z tych modeli użyjemy następującej metody 
najmniejszych kwadratów. Niech (xj,x5,y'), i = 1,...,10, oznaczają znane warto- 
ści naszych zmiennych (czyli i-ty wiersz w powyższej tabelce. Chcemy tak dobrać 
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funkcję f aby suma kwadratów: 


S- F(a4,15))” 

i=1 
była najmniejsza. Suma ta zależy w przypadku A oraz C od dwóch parametrów 
a, b, w przypadku C od trzech parametrów a, b, c. Należy więc rozwiązać zadanie 
optymalizacyjne, a może to być zrobione przy pomocy programu komputerowego. 


MAPLE 
Otrzymaliśmy więc modele: 


A: y= 15.2806 + 0.0120z1 + €. 
B: y= 4.5454 + 0.0116x1 + 3.6240zx02 + €. 
C: y = 44.6444 + 0.0118% + €. 


Powinniśmy teraz ocenić wielkość zaburzenia losowego w każdym modelu. Roz- 
ważamy w tym celu teoretyczne wartości zmiennej y wynikające z modelu, czyli 
liczby ĝt = f(«j,ax5) oraz tak zwane residua, czyli liczby rê = g' — ył. Można wyka- 
zać, że średnia residuów jest równa zeru. natomiast o wielkości zaburzenia decyduje 
jego odchylenie standardowe. W naszych modelach mamy kolejno: 

Najtrudniejszą rzeczą jest ocena jakości modelu i dlatego istnieje wiele kryteriów 
takiej oceny. Ograniczymy się tutaj do dwóch spośród nich. Pierwszym kryterium 
jest wielkość tak zwanego parametru R” określonego następująco: 


10 
N (ry 
„AB i=1 
R=1- A =] 
Seg 
i=1 
gdzie y jak zwykle oznacza wartość średnią z obserwacji y!,...,y'”. Dowodzi się. że 


wielkość ta jest zawsze w przedziale [0,1]. Gdy R? nie jest bliskie 1 uznaje się, że 
model nie jest dobrze dobrany. Natomiast gdy R* jest bliskie 1, należy przystąpić 
do dalszej oceny modelu polegającej na przyjrzeniu się przedziałom ufności poszcze- 
gólnych współczynników. Gdy są one duże, to trudno mieć zaufanie do modelu. 
W szczególności, gdy któryś z nich zawiera 0, nie można wykluczyć, że zmienna, 
którą on reprezentuje nie powinna znaleźć się w modelu. 

Powyższa analiza sugeruje, że modele A i B można uznać za niezłe, natomiast C 
należy odrzucić. Jednak ponieważ przedział ufności dla współczynnika c w modelu 
B jest stosunkowo duży i ponieważ jest tendencja do wybierania modeli prostszych, 
należy wybrać model A. Nie można wreszcie wykluczyć, że na wielkość y mają 
wpływ inne zmienne niż te dwie o których była mowa. 


Mając ustalony model możemy z niego w różny sposób korzystać. Na przykład, 
możemy powiedzieć jakie będą wydatki prasowe w rodzinie o łącznym dochodzie 5000 
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zł. Mianowicie, zgodnie z modelem A wynoszą one: 15.2806 + 0.0120 - 5000 = 75.28. 
Jeżeli nasz model spełnia pewne założenia, o których tutaj nie było mowy, można też 
podać dokładność otrzymanej powyżej prognozy, czyli tak zwany przedział prognozy 
na zdanym poziomie ufności. 


7.11 Cwiczenia i zadania 


Ćwiczenie 7.1 Przypuśćmy, że próbka prosta pochodzi z rozkładu jednostajnego na 
odcinku (0,a), gdzie a > 0 jest nieznanym parametrem. Zastanowimy się, co może 
być „dobrym” estymatorem parametru a. 


Jako sensowne przybliżenie a można wziąć największy element próbki, czyli sta- 
tystykę: 
T(z1,..., 2n) = Mmax{ z1, ..., En}. 


Można udowodnić, że jest to estymator zgodny. Sprawdzimy, czy jest on także nie- 
obciążony. 

Aby obliczyć nadzieję matematyczną zmiennej losowej max(X1,..., Xn}, wy- 
znaczymy najpierw dystrybuantę F oraz gęstość f tej zmiennej, a następnie wyko- 


rzystamy wzór: 
OO 


(MAX Xi p wiiajde 


—00 


Oczywiście, z określenia naszej zmiennej losowej wynika natychmiast, że F(x) < 0 
dla z < 0 oraz F(x) = 1 dla z > a (wtedy też f(x) = 0), zaś dla z € (0,a), z 
niezależności zmiennych X1,..., X, otrzymujemy: 


F(x) = P(max{X1,..., Xn} < £) = POGTS z,..., Xn S z) 


a 
Stąd: 
f(x) =F'(z) = zna” dla x € (0,a), 
zatem: 
E(T(X1,..-, Xn) = zn | gat l de = — a. 
a" 0 n+1l 


Powyższy estymator jest więc obciążony, ale jest także asymptotycznie nieob- 
ciążony. Jednak już teraz widać, że estymatorem nieobciążonym parametru p jest 


estymator: 


n+ l 
Ti (Xes Xn) = m max{ X1, ..., Xn}. 


Zauważmy, iż właściwie można było z góry przewidzieć, że max{X1,..., Xn} 
będzie estymatorem obciążonym, gdyż praktycznie zawsze: 


max{z£1,..., 23n} <a 
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— okazuje się, że wymnożenie przez współczynnik nl zwiększa go tyle, ile trzeba. 


Ćwiczenie 7.2 Innym podejściem do estymacji parametru a w rozkładzie jednostaj- 
nym na przedziale (0,a), jest wykorzystanie wiadomości, że nadzieja matematyczna, 
której „dobrym” estymatorem jest średnia, w tym rozkładzie wynosi z, a więc jako 
estymator a można przyjąć estymator określony przez statystykę: 


S(X1, SZEŃ Xr) = 2T: 


Można łatwo stwierdzić, że jest to estymator zgodny i nieobciążony. Nasuwa się 
więc naturalne pytanie o to, który estymator jest lepszy: estymator Tą, określony 
w ćwiczeniu 7.1, czy zdefiniowany powyżej estymator S. 


Aby odpowiedzieć na powyższe pytanie, należy ustalić jakieś kryterium pozwala- 
jące na porównywanie estymatorów. Wśród estymatorów nieobciążonych kryterium 
tym jest wielkość wariancji, przy czym im mniejsza wariancja, tym lepszy estymator. 
Liczymy więc wariancje Tx i S, wykorzystując (między innymi) wzór na wariancję 
w rozkładzie jednostajnym (patrz przykład 5.11) oraz twierdzenie 5.13 (patrz punkt 
6): 


z 4a? aż 
- lon 3n’ 


2(5) = D25) = D(X +...+ Xn) = Ín 2(X) 


2(T,) = 2 (ZE mafk,...%,) z = AKG N E) 


2 a 2 
= (=) {i E A ( i a) | 
n 0 a” n+l 


z | an an? O a? 
n n+2 (n+nż) n(n+2) 
Dzielimy teraz przez siebie te dwie wariacje: 
D*(S) 2+n 
AT) 3 


>l dlan>l, 


co oznacza, że wariancja estymatora S jest większa od wariancji estymatora T;, 
a w związku z tym, ten drugi estymator jest lepszy w sensie naszego kryterium. Co 
więcej, im większa jest próbka, tym większy jest stosunek obu wariancji. 


Ćwiczenie 7.3 Naturalnym estymatorem parametru p w rozkładzie dwupunktowym 
(0,1,p) jest średnia z próbki. Zauważmy, że tutaj: 
0 k 
T 
n 


gdzie k jest liczbą zaobserwowanych jedynek. Łatwo sprawdzić, że jest to estymator 
zgodny i nieobciążony parametru p. 
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Ćwiczenie 7.4 Rozważmy próbkę prostą 14,..., z, z rozkładu N(m,o). Znajdziemy 
estymatory największej wiarygodności parametrów m io. 
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem: 
1 e-my2 


1 
= -z( o 
L=" 5 


dla z € R. 


W związku z tym, funkcja wiarygodności ma postać: 
1 sień ję 1 
2mo "amo 


oO. 
(v2mo)" 
Z postaci funkcji / od razu widać, że przy każdym ustalonym o przyjmuje ona wartość 
największą dla takiego m, dla którego funkcja: 


l(m,o) = 


osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej 
m, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla: 


m= T. 


Rozważmy zatem funkcję: 
(o) = (v 27)”I(z, 0), 


a następnie jej logarytm: 


Zauważmy, jedynym rozwiązaniem równania: 


L'(o)=0 


jest liczba: 


Ostatecznie więc otrzymujemy następujące estymatory: 


z £... E 2 (£1 — Zn)? +... + (En — Zn)? 
n GG n ` 
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Ćwiczenie 7.5 Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze 
wody, pobrano n próbek wody po 100 ml (próbki typu A) oraz m próbek wody po 300 
ml (próbki typu B). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności 
(nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii 
w k próbkach typu A oraz l próbkach typu B. Jaka jest średnia liczba bakterii w 1 
litrze wody? 


Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy naj- 
pierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega 
w przybliżeniu rozkładowi Poissona — mamy tu bowiem dużo doświadczeń (znale- 
zienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdo- 
podobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa 
objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, 
to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik). 

Niech więc X oznacza liczbę bakterii w 100 ml wody. Zakładamy, że X ma 
rozkład Poissona z parametrem A. W związku z tym zmienna losowa Y , oznaczająca 
liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem 3A. Teraz wyniki 
badania można interpretować następująco: zaobserwowano zdarzenie, polegające na 
jednoczesnym zajściu: 


e k zdarzeń postaci (X; > 0), 

e n— k zdarzeń postaci (X; = 0}, 
e | zdarzeń postaci £Y; > 0), 

e m — l zdarzeń postaci £Y; = 0}, 


gdzie zmienne X; tworzą próbkę prostą z X, zaś zmienne Y; — próbkę prostą z Y. 
Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodo- 
bieństw powyższych zdarzeń. Zauważmy jednak, że: 


a więc: 
P(X; > 0) = P(X > 0) = 1-— e7 
Podobnie: 
P(Y; = 0) = P(Y = 0) = e™®>, 
zatem: 


P(Y; > 0) = P(Y > 0) = 1 — e”, 
Ostatecznie więc funkcja wiarygodności ma postać: 
Ka) = Pa -DPA - aY, 


gdzie q = e *. Widać, że 1(0) = I(1) = 0 oraz że I jest ciągła na przedziale [0,1], 
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek 
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wzór określający funkcję l wydaje się być zbyt skomplikowany, aby można było 
znaleźć analityczną postać tego estymatora. 

W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Ma- 
ple oraz ustalając konkretne wartości parametrów, powiedzmy: 


n=30,k=8,m=5, 1=38. 


Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy 
do 0. Otrzymane równanie można rozwiązać numerycznie w przedziale (0, 1) otrzy- 
mując: 


MAPLE 


4 = 0.7342, 


czyli: 
A= — ln å = 0.3089. 


Tak więc w jednym litrze wody są średnio nieco ponad 3 bakterie. 


Ćwiczenie 7.6 Zmodyfikujemy przykład 1.17. Treść zadania wygląda teraz następu- 
jąco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące 
badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich 
poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni 
wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego 
z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jedne- 
go komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako 
prawdopodobieństwo awarii w czasie jednego dnia pracy? 


Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia 
z przykładu 7.17 widzimy, że funkcja wiarygodności ma teraz postać: 


(p) = aq'ai (1 — a — 1)”, 


gdyż 1 — ag — aı Oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w da- 
nym dniu. Mamy dalej: 


(p) = (0-55) (opt -p?) (1-0 -p)® — 1op(l-p)*) , 


a więc sytuacja jest podobna do tej z ćwiczenia 7.5 — można wziąć logarytm z funkcji 
l, obliczyć jego pochodną i przyrównać do 0, jednak otrzymane w ten sposób równa- 
nie trzeba rozwiązywać numerycznie. Okazuje się, że w tym przypadku estymatorem 
największej wiarygodności parametru p jest: 


MAPLE 


ô = 0.041, 


a więc nieznacznie więcej niż w przykładzie 7.17. 
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Ćwiczenie 7.7 Znajdziemy estymator największej wiarygodności parametru a, w roz- 
kładzie jednostajnym na przedziale (0, a). 


Z warunków zadania wynika, że dysponujemy próbką prostą 1,,... , £n z rozkładu 
ciągłego, którego gęstość f jest następująca: f(x) = L dla 0 < x < a oraz f(x) =0 
dla pozostałych x. Funkcją wiarygodności jest więc tutaj: 


i(a) = f(a1):...* F (En), 
W związku z tym, jeżeli wszystkie punkty z; leżą w przedziale (0, a), to: 


1 
l(a) = am’ 
zaś w przeciwnym wypadku: 
l(a) =0. 


Zatem: 
is + dla a > max{z1,..., 2n} 
m 0 dla0 <a < max{z1,..., 2n}. 


W nietrywialnym przypadku, czyli gdy max(11,...,1«,) > 0, funkcja ta jest dobrze 
określona, lecz nie jest ciągła w punkcie a = max{z1,..., £n}. Jednak widać (narysuj 
wykres funkcji l), że akurat w tym punkcie funkcja l przyjmuje wartość największą. 
Tak więc estymatorem największej wiarygodności parametru a jest: 


î = max{z1,..., Ln}, 


o którym była już mowa w ćwiczeniu 7.1. 


Ćwiczenie 7.8 Dwudziestu losowo wybranych pracowników pewnego dużego przed- 
siębiorstwa sprawdzono pod względem ilości opuszczonych w ostatnim roku dni pra- 
cy. Okazało się, że średnia liczba dni nieobecności wynosi 10.6, natomiast odchylenie 
standardowe jest równe 5.04. Jak można oszacować średnią liczbę dni nieobecności 
w pracy pracowników tego przedsiębiorstwa? 


Aby odpowiedzieć na powyższe pytanie, na początku należy przyjąć pewne za- 
łożenia — w tym przypadku sensownie jest założyć, że liczba dni nieobecności jest 
zmienną losową o rozkładzie normalnym oraz że dane dotyczące tych 20 pracowników 
stanowią próbkę prostą. Teraz sprecyzujmy nasz problem: mamy znaleźć dwustronny 
przedział ufności na zadanym poziomie ufności, powiedzmy 0.95. 

Dalsze postępowanie jest już proste — budujemy przedział ufności dla nadziei 
matematycznej, używając rozkładu Studenta, czyli korzystając ze wzoru (7.4). Tak 
więc, pamiętając, że w naszym przypadku a = 0.05, wyznaczamy (przy pomocy ta- 
blic lub komputera) kwantyl rzędu 0.975 rozkładu Studenta o 19 stopniach swobody, 
który wynosi 2.0930, aby otrzymać następujący przybliżony przedział ufności: 


2.0930 2.0930 
, 10.6 + 5.04 
V20 V20 


(106 — 5.04 ) = (8.2412, 12.9588). 
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Podkreślamy wyraźnie, iż nie jest to przedział ufności dla liczby dni opuszczonych 
przez pracownika, lecz dla wartości oczekiwanej liczby takich dni. 


Ćwiczenie 7.9 Aby zbadać wadliwość nowej serii dysków komputerowych, wybrano 
losowo 30 wyprodukowanych dysków i poddano je szczegółowym testom. Okazało się, 
że aż 4 spośród nich uległo awarii. Jaka jest minimalna wadliwość dysków z tej serii? 


Mamy tutaj wyznaczyć przedział ufności dla nieznanej wadliwości p, a z tre- 
ści zadania wynika, że ma to być przedział postaci (p;,1) (górny koniec przedziału 
równy 1 jest w tej sytuacji oczywisty). Ponieważ wielkość próbki pozwala na zastoso- 
wanie odpowiedniego wzoru (jakiego?), otrzymujemy następujący 90% przybliżony 
przedział ufności: 

(0.0538, 1). 


Mówiąc językiem potocznym, mamy 90% pewności, że średnio ponad 5% dysków 
będzie się psuło. Analogicznie, możemy także wyznaczyć 90% przybliżony przedział 
ufności postaci (0, p2), otrzymując: 


(0, 0.2129), 


co oznacza, że nie powinno się psuć średnio więcej niż 21% dysków. 


Ćwiczenie 7.10 Aby sprawdzić, czy pewna cecha ma średnią wartość 
m = 20, wykonano 50 pomiarów tej cechy otrzymując średnią wartość próbki z = 
20.63 i odchylenie standardowe w próbce s = 2.66. Możemy więc przypuszczać, że 
średnia wartość cechy jest większa od 20. 


Wykonujemy tutaj test hipotezy: 
Ho: m = 20, 


wobec hipotezy alternatywnej: 
H;:m > 20. 


Poniżej podajemy dwa niezależne rozwiązania tego zadania. 


I. Rozwiązanie klasyczne wykorzystujące zbiór krytyczny. 
Wykorzystamy statystykę Zn: 


X — 
We c EM 
8 


która, jak wiemy, przy założeniu, że m = 20 posiada w przybliżeniu rozkład N(0, 1) 
(pamiętajmy, że n = 50). Ponieważ małe wartości tej statystyki wskazują na hipotezę 
zerową, zaś duże — na hipotezę alternatywną, tak więc zbiór krytyczny K ma tutaj 
postać: 

K = [b,oo). 


148 


Ustalamy poziom istotności, na przykład a = 0.05, a następnie dobieramy tak liczbę 
b, aby: 
P(W, eK)=P(W,żb)=1—9(b) =a. 


Zatem: 
b=P'(fl-a), 


czyli w naszym przypadku zbiór krytyczny to: 
K = [1.64,06). 


Obliczamy teraz wartość statystyki W, na podstawie danych otrzymanych z próbki: 


20.63 — 20 
= ZA V50 ~ 1.6747. 
a 2.66 


Jak widać, powyższa wartość należy do zbioru krytycznego K, a więc odrzucamy 
hipotezę zerową na korzyść hipotezy alternatywnej. Gdybyśmy jednak testowali na- 
szą hipotezę na poziomie istotności a = 0.01, to otrzymalibyśmy b = 2.3263, a więc 
wówczas wartość w nie należałaby do zbioru krytycznego K = [2.3263, oo), czyli na 
tym poziomie istotności nie byłoby podstaw do odrzucenia hipotezy Ho. 


II. Rozwiązanie wykorzystujące wartość-p. 
Podobnie jak poprzednio rozważamy tę samą statystykę W,, której wartość umie- 
my obliczyć, gdyż zakładamy Ho — jest nią oczywiście: 


w = 1.6747. 
Przy hipotezie Hı: m > 20, otrzymujemy: 
wartość-p = P(Z50 > w)£1— (w) ~ 1 — 0.953 = 0.047. 
Zatem na poziomie istotności a = 0.05 odrzucamy Hy, zaś na poziomie istotności 


a = 0.01 nie mamy podstaw, aby tak uczynić. 


Chociaż obie powyższe metody doprowadziły do tej samej konkluzji zauważmy, 
że ta druga metoda posiada przewagę nad pierwszą, gdyż wyliczona wartość-p daje 
pewną dodatkową informację: przy założeniu hipotezy zerowej prawdopodobieństwo 
tego, że wylosowana próbka będzie miała średnią nie mniejszą niż 20.63, wynosi 
w przybliżeniu 0.047. Tak więc stosując tę drugą metodę można, w zależności od 
sytuacji, bardziej świadomie przyjąć lub odrzucić hipotezę Ho. 


Ćwiczenie 7.11 Po wykonaniu 15 rzutów monetą okazało się, że reszka wypadła 
w 10 rzutach. Czy moneta jest symetryczna? 
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Testujemy tutaj hipotezę, że w rozkładzie dwupunktowym (0,1,p) parametr p 
wynosi 0.5, przy hipotezie alternatywnej, że p > 0.5, gdzie p jest prawdopodobień- 
stwem wyrzucenia reszki. Jako statystykę weźmiemy liczbę sukcesów k w schema- 
cie Bernoulliego — statystyka ta ma rozkład dwumianowy, zaś zakładając hipotezę 
zerową znamy parametr tego rozkładu. Zdarzeniem sprzyjającym hipotezie alterna- 
tywnej jest tutaj zbiór: 

{10, 11, 12, 13, 14, 15}, 


zatem: e 
= 15) 1 
walrtość-p = 5 ( i | 215* 
i=10 
Powyższą sumę liczymy bezpośrednio (przy użyciu komputera) lub zauważamy, że: 
wartość-p = P(k > 10) = 1 — P(k < 9) = 1 — F (9), 
gdzie F jest dystrybuantą rozkładu dwumianowego o parametrach n = 15 i p = 0.5, 


której wartości można wyznaczyć za pomocą programów komputerowych typu Maple 
lub Excel. Mamy więc: 


MAPLE 


wartość-p = 1 — .8491 = 0.1509. 


W tej sytuacji nie powinno się odrzucać hipotezy, że moneta jest symetryczna. 


Ćwiczenie 7.12 Po wykonaniu 60 rzutów monetą okazało się, że reszka wypadła 
w 40 rzutach. Czy moneta jest symetryczna? 


Chociaż wydaje się, że jest to prawie takie samo zadanie jak poprzednio, różniące 
się jedynie danymi liczbowymi, które powstały po wymnożeniu danych z ćwiczenia 
7.11 przez 4, mimo to je rozwiążemy. 

Zauważmy, że pożyteczną statystyką jest tutaj (k oznacza liczbę sukcesów): 


E_p 
dee E z 
” 4/p(l-p) 


która, przy założeniu, że p = 0.5, ma w przybliżeniu standardowy rozkład normalny 
(dlaczego?), a której wartość na naszej próbce wynosi: 


40 05 


z= —® ~ V60 ~ 2.7386. 
40 (1 — 40) 
60 60 


Zatem: 
wartość-p = P(Z, > z) z 1 — ©(z) z 1 — 0.9969 = 0.0031, 


co oznacza, że hipotezę o symetryczności monety należy odrzucić, a ewentualny błąd 
z tego wynikający wynosi około 0.3%. 
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Ćwiczenie 7.13 Dana jest następujące próbka prosta: 


3.36, 1.43, 0.151, 10.7, 3.12, 12.8, 3.54, 31.5, 3.26, 1.91, 9.89, 8.74, 0.151, 3.37, 
19.3, 1.58, 9.24, 4.04, 8.89, 2.67, 6.38, 12.5, 4.25, 3.32, 12.1, 4.29, 1.69, 0.546, 
8.50, 5.47, 9.50, 3.15, 13.5, 18.4, 22.1, 4.58, 5.42, 3.01, 29.7, 8.86, 6.58, 6.28, 
0.245, 0.336, 3.99, 3.24, 8.13, 10.2, 1.24, 12.6, 2.84, 1.89, 16.4, 3.99, 2.90, 11.4, 
12.6, 8.12, 1.24, 3.09, 3.62, 1.69, 1.49, 13.5, 5.63, 32.3, 0.303, 4.33, 0.0869, 6.83, 
1.91, 23.4, 0.321, 5.10, 1.26, 6.98, 3.53, 0.681, 9.85, 1.90, 15.0, 12.4, 1.09, 2.96, 
20.1, 15.0, 1.74, 32.2, 6.07, 3.16, 1.07, 1.20, 4.68, 5.84, 2.10, 6.86, 1.61, 0.241, 
0.0673, 2.32, 5.49, 11.5, 10.9, 3.44, 0.459, 1.63, 43.8, 12.0, 2.41, 2.53, 11.0, 1.52, 
15.8, 3.95, 2.14, 10.5, 11.2, 5.22, 13.9, 8.19, 3.95, 13.9, 5.19, 5.44, 1.36, 0.907, 
4.16, 2.49, 2.70, 4.55, 1.81, 6.48, 1.29, 3.15, 10.6, 3.07, 10.3, 0.110, 1.44, 11.1, 
1.56, 4.48, 16.5, 0.116, 1.76, 3.64, 10.6, 26.2, 2.16, 5.21, 4.86, 1.05, 8.91, 15.7, 
3.0, 2.28, 10.7, 13.8, 19.0, 6.49, 1.60, 6.67, 6.51, 4.68, 2.11, 1.66 , 0.312, 0.311, 
19.0, 2.32, 8.26, 9.15, 2.01, 5.41, 1.52, 1.27, 2.12, 1.98, 4.81, 2.12, 1.25, 13.9, 
10.2, 2.46, 5.23, 5.14, 10.2, 3.16, 0.451, 12.1, 14.5, 12.0, 3.05, 18.8, 1.83, 10.2, 
1.09, 6.98, 13.3, 0.401. 


Pytamy się o typ rozkładu, z którego ona pochodzi. 


Zaczniemy od narysowania histogramu: 


10 20 30 40 


Wydaje się, że nieznany rozkład Py może mieć charakter wykładniczy. Stawiamy 
więc hipotezę: 
Ho: Px € P, 


przeciw hipotezie alternatywnej: 
Ho: Px ¢ P, 


przy czym P jest rodziną rozkładów wykładniczych. Jak wiemy z rozdziału 6, jest 
to rodzina zależna od jednego parametru A. Pamiętamy też (patrz przykład 7.18), 
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że estymatorem największej wiarygodności parametru A jest: 


zatem, wykorzystując daną próbkę, otrzymujemy: 
A m 0.1393753281. 
Tak więc szukanym rozkładem Q jest rozkład wykładniczy o parametrze: 
X = 0.1393753281. 
Tworzymy teraz szereg rozdzielczy wybierając następujące punkty podziału: 
0, 5, 10, 20, 30, 100. 


Podkreślamy, że jest to w dużej mierze wybór arbitralny, choć istnieją pewne wska- 
zówki praktyczne przemawiające za takim wyborem. Mamy więc tutaj k = 5 klas, 
których liczności wynoszą odpowiednio: 


98, 49, 44, 5, 4, 
natomiast (przybliżone) prawdopodobieństwa „teoretyczne” są następujące: 
0.50186, 0.25000, 0.18657, 0.04630, 0.01528. 
Ponieważ wartość 40 statystyki x wynosi: 
Xo = 3.525189694, 


zaś wartość-p obliczamy korzystając z rozkładu x? o 3 (= 5—1— 1) stopniach 
swobody, otrzymujemy: 
wartość-p = 0.3175097675. 


Tak więc nie można odrzucić hipotezy zerowej na żadnym sensownym poziomie 
istotności. Mówiąc krótko, jesteśmy przekonani, że nasza próbka pochodzi z rozkładu 
wykładniczego. 


Ćwiczenie 7.14 Podane poniżej współrzędne punktów odpowiadających obserwa- 
cjom pewnej wielkości fizycznej w chwilach czasu 1,2,3,...,100. 


[[1, 226.7), [2, 178.8], [3, 130.4], [4, 371.6], [5, 261.5], [6, 399.1), [1, 278.2], [8, 
461.0], [9, 285.5], [10, 385.4], [11, 416.8], [12, 410.9), [18, 230.8], [14, 325.0], [15, 
496.1], [16, 283.6], [17, 452.3], [18, 310.1], [19, 462.2], [20, 341.0], [21, 439.5], [22, 
515.6], [23, 409.4], [24, 392.5], [25, 532.1], [26, 430.0], [21, 361.3], [28, 324.1], [29, 
523.0], [30, 480.9], [31, 541.1], [32, 454.3], [33, 591.6], [34, 591.3], [35, 633.3], [36, 
498.3], [31, 521.7], [38, 469.8], [39, 662.9], [40, 592.6], [41, 565.8], [42, 566.1], [43, 
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399.3], [44, 408.1), [45, 534.2], [46, 520.1], [47, 628.1), [48, 
619.4], [51, 534.1], [52, 649.1], [53, 114.0], [54, 519.5], [55, 
113.4], [58, 674.3], [59, 518.4], [60, 583.4], [61, 602.1], [62, 
149.1], [65, 664.3], [66, 194.9], [67, 514.6], [68, 648.7), [69, 
591.4], [12, 811.5], [13, 538.2], [14, 100.1], [15, 582.7], [76, 
510.6], [19, 116.4], [80, 622.8], [81, 819.7], [82, 801.6], [83, 
848.5], [86, 834.6], [87, 638.0], [88, 869.3], [89, 153.1), [90, 
180.2], [93, 135.8], [94, 162.0], [95, 689.0], [96, 184.3], [91, 
601.0], [100, 688.3]] 


650.3], [49, 471.1], [50, 
554.9], [56, 699.8], [51, 
541.9], [63, 545.2), [64, 
513.1], [70, 105.3], [11, 
129.3], [11, 661.5], [18, 
602.7], [84, 661.9], [85, 
106.4], [91, 623.9], [92, 
198.1), [98, 606.8], [99, 


Postaramy się dobrać odpowiedni model regresji. Wykorzystamy w tym celu pro- 


gram Maple. 


MAPLE 
Najpierw przedstawimy nasze dane w formie graficznej: 


100 


Wydaje się, że dobrym modelem może być tutaj model regresji liniowej, czyli 


model: 
y=a+bx+e. 


Zmienną niezależną x jest więc pierwsza współrzędna danych punktów, a zmienną 
zależną druga współrzędna tych punktów. Wykorzystując Maple otrzymujemy: 


y = 323.70661 + 4.65520x + €, 


który graficznie można interpretować następująco: 
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Współczynnik R? = .3926653665 sugeruje, że model regresji liniowej nie jest zbyt 
dobry. 
Spróbujemy więc model regresji kwadratowej: 


y=a+bx+cz? +e. 


Tutaj mamy dwie zmienne niezależne: tak jak poprzednio pierwsza współrzędna 
danych punktów oraz kwadrat tej współrzędnej. Zmienna zależna jest taka sama jak 
poprzednio. Otrzymujemy model: 


z = 253.28567 + 8.79760 x x — .04101 x £? +€ 


oraz jego interpretację graficzną: 


Teraz współczynnik R? = .92859, co oznacza, że model ten warto rozpatrywać. 
Rozpatrując przedziały ufności okazuje się, że współczynniki te są istotne na pozio- 
mie ufności 0.95, to znaczy żaden przedział ufności nie zawiera zera. Tak więc model 
można uważać za dobrze dobrany. 
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Zadanie 7.1 Wylosowano następującą próbkę prostą z rozkładu geometrycznego: 
8, 10, 11, 11, 3, 8, 10, 12, 17, 16, 14. 
Jaka liczba będzie dobrym przybliżeniem parametru p? 


Zadanie 7.2 Wylosowano następującą próbkę prostą z rozkładu jednostajnego na 
odcinku (—a, a): 


—2.11, —4.71, 1.63, —2.52, 3.33, 0.46, 1.02, —0.96. 
Jak przybliżyć wartość parametru a? 


Zadanie 7.3 Dana jest próbka prosta X1,..., X, z rozkładu dwupunktowego (0, 1, p). 
Znajdź rozkład estymatora X. 


Zadanie 7.4 Uzasadnij tezy zawarte w przykładzie 7.5. 

Zadanie 7.5 Uzasadnij, że estymator § z ćwiczenia 7.2 jest zgodny i nieobciążony. 
Zadanie 7.6 Zaproponuj estymator odchylenia standardowego. 

Zadanie 7.7 Zaproponuj estymator parametru A w rozkładzie Poissona. 
Zadanie 7.8 Zaproponuj estymator parametru A w rozkładzie wykładniczym. 


Zadanie 7.9 Sprawdź, że estymator: 
1 n 
s (Xi, Xn) = A ) (X; — m)”, 
i=1 


jest zgodnym estymatorem wariancji (m, jak zwykle, oznacza nadzieję matematyczną 
X). 


Zadanie 7.10 Czy następujący estymator: 


satut ` ) (52 


i c= 
jest obciążonym estymatorem odchylenia standardowego? 


Zadanie 7.11 Wykorzystując statystykę pozycyjną, zaproponuj estymator kwan- 
tyla qp. 
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Zadanie 7.12 Wykaż wzór: 


n n 
M (©; - 7)? = 36% — na”. 
i=1 i=1 
Zadanie 7.13 Wykonaj 100 razy następujący eksperyment: z rozkładu jednostaj- 


nego na przedziale (0,10) losujemy 30 liczb i obliczamy wartości statystyk 2% oraz 


U max/T1,..., £n}. Otrzymasz dwa ciągi liczb, powiedzmy a1, .. . , @100 oraz by,..., 


b100. Dla każdego z tych dwóch ciągów oblicz średnią i wariancję. Porównaj otrzy- 
mane wyniki z wnioskami zawartymi w ćwiczeniu 7.2. 


Zadanie 7.14 Znajdź wartość największą (o ile istnieje) funkcji f na zbiorze A: 
1. f(x) = z? — x? + 8z — 2, A=|—2.2), 
2. f(x) =x -— vr? +8r-—2, A= [0.4], 
3. f(x) = xz? ln |z| dla z 40, f(0)=0, A=R, 
4. f(e) =x- 5, A= iA, 
5. f(x) = max{z, 1 — z?}, A = (0,1), 
6. f(x) = ell, A=R, 
7T. f(x) = =, A = {0,1,2,...}. 


Zadanie 7.15 Wyprowadź wzór na estymator największej wiarygodności parame- 
tru p, gdy próbka prosta pochodzi z rozkładu geometrycznego. 


Zadanie 7.16 Wyprowadź wzór na estymator największej wiarygodności parame- 
tru A, gdy próbka prosta pochodzi z rozkładu Poissona. 


Zadanie 7.17 Testowano czas działania T nowej serii baterii do telefonów komór- 
kowych. Otrzymano następujące wyniki (w godzinach): 


239, 209, 208, 235, 226, 204, 203, 204, 217, 232, 


natomiast pięć innych baterii działało dłużej niż 240 godzin. Znajdź estymator pa- 
rametru p zakładając, że rozkładu czasu działania baterii jest postaci: 


P(T = k) =(1-p)* "ip dla k = 201,202,203,.... 


Korzystając z otrzymanego wyniku, określ średni czas działania baterii oraz oblicz 
prawdopodobieństwo tego, bateria z tej serii działa dłużej niż 220 godzin. 


Zadanie 7.18 Metodą największej wiarygodności znajdź estymator parametru a, 
gdy próbka 11,...,«n pochodzi z rozkładu jednostajnego na odcinku (—a,0). 
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Zadanie 7.19 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile 
było rzutów? 


Zadanie 7.20 Mamy próbkę prostą 11,...,«, z rozkładu wykładniczego oraz wie- 
my, że k dalszych niezależnych obserwacji x; z tego rozkładu ma wartość większą 
niż dana liczba 7. Jaka jest nadzieja matematyczna tego rozkładu? 


Zadanie 7.21 Przypuszcza się, że mniej niż 20% mieszkańców pewnego miasta nie 
czyta gazet codziennych. Czy hipoteza ta jest prawdziwa, jeżeli na pytanie zadane 
50 mieszkańcom, 38 osób odpowiedziało, że czyta gazety codzienne? 


Zadanie 7.22 Wylosuj 20 liczb z rozkładu N(29,2) i traktując te liczby jako daną 
próbkę przeprowadź test hipotezy, że wartość średnia rozkładu, z którego pochodzą 
te liczby, wynosi 30, przy różnych hipotezach alternatywnych, jeżeli: (a) wariancja 
rozkładu jest znana i równa 4, (b) wariancja rozkładu nie jest znana. 


Zadanie 7.23 Powtórz poprzednie zadanie losując próbkę z rozkładu jednostajne- 
go na odcinku (28,30). 


Zadanie 7.24 Naszkicuj wykres gęstości rozkładu X? o k stopniach swobody, gdzie: 
(a) k=l, (b) k=2. 
Zadanie 7.25 Wylosuj 100 liczb z rozkładu N(10,3), a następnie testem X? sprawdź 
hipotezę, że pochodzą one z rozkładu: (a) N(10,3), (b) N(8,1), (c) N(8,5). 
Zadanie 7.26 Wylosuj 100 liczb z rozkładu jednostajnego na odcinku (0, 20), a na- 
stępnie testem x? sprawdź hipotezę, że pochodzą one z rozkładu normalnego. 
Zadanie 7.27 Dla liczb zı = 1, ..., 159 = 50 wylosuj liczby y; według modelu 

y = 200 + 2z — 0.1£? + €, 
gdzie e € N (0,10). Do tak dobranych punktów (z;, y;) zbuduj model regresji liniowej 
i oceń jego jakość. Wykonaj rysunek. 


Zadanie 7.28 Mając dane z poprzedniego zadania sprawdź rachunkowo, że 


n n n 


Su- =X lui- h +) (6-9). 
i=1 


i=1 i=1 
Zadanie 7.29 Dla liczb zı = 1/20,..., £29 = 1 (= 20/20) wylosuj liczby y; według 
modelu 

y=1+3x(1-—x)+e, 
gdzie e e N(0,0.3). Do tak dobranych punktów (z;, yi) zbuduj modele regresji linio- 
wej oraz regresji kwadratowej i oceń ich jakość. Wykonaj rysunek. 


Zadanie 7.30 Dla liczb zı = 1, ..., £20 = 30 wylosuj liczby y; według modelu 
y=v5+20+E, 


gdzie € e N(0,1). Do tak dobranych punktów (z;,y;) zbuduj model regresji y = 
a + blnz i oceń jego jakość. Wykonaj rysunek. 
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Rozdział 8 


Komputerowe metody statystyki 


W ostatnim rozdziale poznamy pewne metody, które zostały opracowane w drugiej 
połowie XX wieku, a ich przewodnią ideą jest wykorzystanie dużej mocy obliczenio- 
wej komputera. Metody te są dziś w powszechnym użyciu. 


8.1 Liczby pseudolosowe 


W trakcie tego kursu kilkakrotnie wykorzystaliśmy liczby wylosowane przez kompu- 
ter z zadanego rozkładu. Teraz opiszemy jedną z metod używanych przez współcze- 
sne programy komputerowe do ich uzyskiwania. Otrzymane w ten sposób liczby nie 
są w istocie losowe, lecz są wynikiem działania pewnego dość prostego algorytmu 
deterministycznego. Dlatego też określa się je często mianem liczb pseudolosowych. 

Obecnie wykorzystywane programy komputerowe używają najczęściej następują- 
cego algorytmu: dla ustalonych liczb naturalnych a, b i p wybieramy dowolną liczbę 
naturalną Xg, zwaną ziarnem (ang. seed), a następnie określamy rekurencyjnie ciąg: 


Xn+1 = aX, +b (mod p). 


Mówiąc inaczej, za każdym razem obliczamy X, ,, = aX, +b, a jako X„41 bierzemy 
resztę z dzielenia X, ,, przez p — tak więc wszystkie wyrazy naszego ciągu są liczbami 
naturalnymi mniejszymi od p. Jeżeli parametry a, b, pi Xo są odpowiednio dobrane, 
to okazuje się, że liczby: 

Un = Xn/p 


mają własności niemal takie same, jak liczby wylosowane z rozkładu jednostajnego 
na przedziale (0, 1). 

Istnieją pewne zasady wybierania parametrów. W szczególności, p powinno być 
bardzo duże, aby jak najbardziej ograniczyć zjawisko okresowości. Z podobnych 
względów także a powinno być dużą liczbą, najlepiej względnie pierwszą z p. Na- 
tomiast wybór b ma mniejsze znaczenie — często przyjmuje się b = 0. Okazuje się, 
że przy odpowiednio wybranych parametrach oraz przy zastosowaniu dodatkowych 
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procedur (patrz poniżej) liczby pseudolosowe i ich zestawy mają bardzo dobre wła- 
sności — potwierdzają to także odpowiednie testy statystyczne. Przykładowo, pro- 
gram Maple (już w wersji 5) używa generatora liczb pseudolosowych z bardzo dużymi 
parametrami a oraz p, mianowicie: 


a = 427419669081, p = 999999999989. 


Wartość ziarna Xo można w każdej chwili zadać zgodnie z aktualnymi potrzeba- 
mi. Może nam na przykład zależeć, aby przy powtórzeniach danego losowania zawsze 
otrzymywać te same liczby pseudolosowe — zadajemy wtedy taką samą (stałą) war- 
tość Xo (przy rozpoczęciu nowej sesji z programem Maple wartość ziarna wynosi 1). 
Z drugiej strony, możemy żądać, aby w każdym losowaniu otrzymywać inne liczby 
pseudolosowe — można to na przykład osiągnąć, zadając wartość ziarna w zależności 
od upływu czasu zużytego przez procesor od rozpoczęcia aktualnej sesji. 

Bardzo ważne jest też to, aby kolejne liczby pseudolosowe reprezentowały nieza- 
leżne zmienne losowe. Oczywiście, formalnie one są zależne, jednak przy odpowiednio 
dobranych parametrach zależność ta jest niezwykle słaba. Co więcej, stosuje się cza- 
sem dodatkowe zabezpieczenia polegające na odrzucaniu niektórych liczb. 


Mając liczby pseudolosowe z rozkładu jednostajnego na odcinku [0,1], można, 
stosując odpowiednią metodę, uzyskać liczby pseudolosowe z innego zadanego roz- 
kładu — poniżej opisujemy jedną z takich metod, zwaną metodą odwracania dystry- 
buanty. 

Niech 6 będzie zmienną losową o rozkładzie jednostajnym na przedziale (0, 1), 
czyli: 


0, z<0 
Piesaj=( xz, US<g<l 
1, 1<Xz, 


oraz niech F będzie dystrybuantą interesującego nas w danej chwili rozkładu. Dla 
uproszczenia załóżmy, że F jest funkcją ściśle rosnącą. Określamy nową zmienną 
losową 7 jako: 


n = F(E). 
Wówczas dla każdego x € R mamy: 


P(n < z) = P(F"'(£) < z) = P(E < F(x)) = F(x). 


Wynika stąd, że F jest dystrybuantą zmiennej losowej 7. Mówiąc inaczej, jeżeli liczby 
xi zostały wylosowane zgodnie z rozkładem jednostajnym na przedziale (0,1), to 
F-!(x;) mogą być traktowane jako liczby wylosowane z rozkładu o dystrybuancie 
F. 


8.1 PRZYKŁAD 
Aby wylosować liczbę pseudolosową z rozkładu wykładniczego, rozważamy jego dys- 
trybuantę: 

F(x)=1-e7™ dlaz>0. 
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W związku z tym, mając daną liczbę pseudolosową u z rozkładu jednostajnego na 
odcinku (0, 1), znajdujemy liczbę pseudolosową: 


1 
F(u) = -— n(1 — u) 
A 
z rozkładu wykładniczego. 


Zauważmy, że nie zawsze jest łatwo wyznaczyć efektywnie F"! — jest tak na 
przykład w przypadku rozkładu normalnego. W takich sytuacjach można szukać 
przybliżonej wartości F7!(u), rozwiązując numerycznie równanie: 


F(x)=u 


ze względu na z. Istnieją też inne metody pozyskiwania liczb pseudolosowych z nie- 
których rozkładów (na przykład rozkładu normalnego), na bazie liczb pochodzących 
z rozkładu jednostajnego. 


8.1.1 Metoda bootstrap 


W ostatnich latach stosuje się coraz powszechniej tak zwaną metodę bootstrap. Robi 
się to wtedy, gdy nie znamy rozkładu, z którego pochodzi próbka, a jej wielkość jest 
zbyt mała, aby stosować metody oparte na prawach wielkich liczb. 

Metoda bootstrap polega na losowaniu kolejno B próbek na podstawie wyjścio- 
wej próbki, przy czym losowanie odbywa się ze zwracaniem, a wielkości próbek są 
takie same jak wielkość próbki wyjściowej. Jeżeli chcemy estymować dany parametr 
i znamy jego estymator, powiedzmy g(X1,..., Xn), to estymator bootstrapowy da- 
nego parametru określamy jako średnią z wartości tego estymatora obliczonych dla 
każdej próbki, czyli: 


B 


i 1 , : 
Ô(£1,..., En) = B IE o n) 
i=1 
gdzie x;,...,at jest próbką wylosowaną za i-tym razem. 
1 n ą 


8.2 PRZYKŁAD 
Przypuśćmy, że mamy daną następującą próbkę prostą z nieznanego rozkładu: 


2, 3, 3, 3, 7, 10, 12. 


Interesuje nas bootstrapowy estymator średniego błędu. 
Pamiętamy, że średni błąd wyraża się wzorem: 


1 n 
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Losujemy teraz 10 próbek bootstrapowych, przy czym każda taka próbka ma 7 
elementów otrzymanych jako wynik losowania ze zwracaniem z podstawowej próbki, 
jednocześnie wyznaczając dla każdej z nich wartość b. Dostajemy przykładowo: 


MAPLE 


7, 12, 12, 3, 7, 10, 3; b% 3.10, 
3, 3, 3, 10, 7, 3, 2; b% 2.33, 
7, 3, 3, 3, 3, 3, 3; bæ 0.98, 
3, 2, 3, 7, 3, 7, 10; b% 2.57, 
3, 3, 12, 3, 10, 3, 2; b= 3.35, 

7, 3, 2, 10, 7, 10, 12; b= 2.90, 

3, 12, 3, 10, 7, 12, 12; b% 3.51, 
3, 7, 3, 3, 12, 3, 3; b% 2.65, 
2, 2, 3, 7, 7, 3, 3; b= 1.80, 
3, 3, 3, 3, 12, 3, 2; b% 2.24. 


Liczymy teraz średnią z tak otrzymanych 10 średnich błędów dla poszczególnych pró- 
bek i otrzymujemy estymator bootstrapowy średniego błędu równy w przybliżeniu 
2.54. 


Na ogół losuje się dużo więcej niż w powyższym przykładzie próbek bootstrapo- 
wych — często jest to 1000 próbek. 

Metodę bootstrap można używać także do wyznaczania przedziałów ufności okre- 
ślonych parametrów. Istnieje tutaj kilka metod — my poznamy, na przykładzie, tak 
zwaną metodę percentylową. 

Przypuśćmy, że na podstawie naszej próbki chcemy wyznaczyć 90% przedział uf- 
ności dla średniego błędu. Postępujemy wówczas następująco: losujemy 1000 próbek 
bootstrapowych i dla każdej z nich obliczamy żądany estymator, powiedzmy średni 
błąd, otrzymując ciąg: 

bs, siii bs1000- 


Dla jego zobrazowania rysujemy odpowiedni histogram: 
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E 


1 2 3 4 5 


Kwantyle tego ciągu rzędu 0.05 i 0.95 są (z definicji) końcami szukanego przedziału 
ufności — w naszym przypadku okazał się być nim przedział: 


(1.10, 4.08). 


8.2 Estymacja gęstości 


Zdarza się, iż w niektórych sytuacjach nie wiemy z góry, z jakiego rozkładu pochodzi 
próbka prosta. Warto wówczas oczywiście naszkicować histogram, ale jeżeli próbka 
wskazuje na to, że rozkład jest ciągły, to warto także sporządzić tak zwany jądrowy 
estymator gęstości, który w tym punkcie omawiamy. Jego podstawową zaletą (w 
stosunku do histogramu) jest to, że jest on na ogół funkcją ciągłą. 

Funkcję K: R — R nazywamy jądrem, gdy: 


(1) K(x) > 0 dla każdego z € R, 

2. K(z)dz =1, 

(3) K(-z) = K(x) dla każdego z € R. 
Przykładami jąder są następujące funkcje: 


2 


1. K(x) = HeT — jądro gaussowskie, 
3 2 
3 (1 — 1 
2. K(x) = i nip A A > | jądro Epanesznikowa, 


-_Jd=lE. Blsl >. zę 
3. K(x) = l 0. lel>1 — jądro trójkątne. 


Niech będzie dana próbka prosta x1,...,Tq z rozkładu ciągłego o gęstości f. 
Ustalmy jądro K oraz liczbę h > 0 zwaną dalej szerokością pasma. Funkcję: 


o= zar) 
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nazywamy estymatorem jądrowym gęstości f. 
Stosując kolejno następujące zmiany zmiennych: 


I — Ti 
t= 


dlaż=1,...,n, 


można łatwo sprawdzić, że: 
00 A 
J f(x)dz=1. 
— OO 


Oczywiście także: 


f(x) 20 dla wszystkich z € R, 


tak więc funkcja f jest gęstością rozkładu prawdopodobieństwa. Zauważmy dodat- 
kowo, że gdy jądro jest funkcją ciągłą, tak jak w podanych powyżej przykładach, to 
także f , jako suma funkcji ciągłych, jest funkcją ciągłą. 

Można łatwo zrozumieć powód, dla którego jądrowy estymator gęstości f powi- 
nien dobrze przybliżać daną gęstość f. Otóż, gdy f(x) jest dużą liczbą, to należy 
się spodziewać, że w pobliżu punktu «x znajduje się stosunkowo dużo punktów 2; 


z naszej próbki, a zatem także wartości K (+) odpowiadające tym punktom są 


stosunkowo duże, a więc duża jest też wartość f (x). Przeciwnie, tam gdzie wartości 
f(x) są małe, tam jest niewiele (albo wcale nie ma) punktów próbki i może się zda- 
rzyć, że niemal wszystkie składniki K (5%) będą bliskie zeru, a więc także f(x) 
będzie niewielką liczbą. 

Zauważmy jednak, że do wyznaczenia pojedynczej wartości f (x) należy, oprócz 
innych działań, wykonać obliczenia tylu wartości K (%3), ile jest elementów próbki 
— w praktyce jest to możliwe tylko przy użyciu komputera. 

Istnieją przesłanki zarówno teoretyczne, jak praktyczne, dotyczące wyboru jądra 
oraz szerokości pasma, tak aby estymator f najlepiej, w pewnym określonym sensie, 
przybliżał gęstość f. Mówiąc ogólnie, warto jest używać jąder wymienione powyżej, 
natomiast h można ustalać jako liczbę nieznacznie większą od = gdzie 6 oznacza 


estymator odchylenia standardowego z próbki, czyli: 


6 


„CRT RE: 


8.3 PRZYKŁAD 

Dla zilustrowania metody estymacji jądrowej wylosujemy 250-elementową próbkę 
prostą z rozkładu N(50, 3), a następnie, wykorzystując jądro gaussowskie, wyznaczy- 
my estymator f (kolor czerwony) i narysujemy go na wspólnym rysunku z gęstością 
rozkładu N (50,3) (kolor niebieski). 


MAPLE 
Zastosujemy tu trzy różne szerokości pasma h: 
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1. h = 0.6: 


2. h= 1.4: 


3. h = 1.05: 


0.12 


0.14 


0.044 


0.024 


0.14 


0.084 


0.04 


0.024 


52 


0.12 


0.1 


0.08 4 


0.04 - 


0.024 


52 
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ożna zauważyć, że małe wartości h powodują, że wykres f jest stosunkowo nie- 

regularny, ale za to „wychwytuje” poszczególne punkty próbki, natomiast dużym 

wartościom h odpowiada stosunkowo gładki wykres f. W powyższym przykładzie 
6 = 2.92, a więc: A 
ô 


E ~ 0.97 
250 


8.3 Cwiczenia i zadania 


Ćwiczenie 8.1 Sprawdzimy graficznie jakość liczb pseudolosowych wylosowanych 
z rozkładu normalnego, przy pomocy programu Maple. 


MAPLE 


Losujemy w tym celu próbkę prostą, powiedzmy 300 elementową próbkę z roz- 
kładu N (20,2), a następnie sporządzamy na jej podstawie histogram, który umiesz- 
czamy na wspólnym rysunku z gęstością danego rozkładu: 


Ćwiczenie 8.2 Podczas losowania ciągów liczb pseudolosowych bardzo ważną kwe- 
stią jest to, aby można było te liczby traktować jako realizacje niezależnych zmien- 
nych losowych. Nie omawiamy tutaj odpowiednich testów statystycznych, jednak pre- 
zentujemy pewną metodę graficzną, pomocną przy ocenie tej niezależności. Polega 
ona na zaznaczaniu na wspólnym rysunku punktów postaci (£i-ķ, xi), gdzie k > 1 
jest ustalone, zaś c; są wylosowanymi liczbami. Jeżeli otrzymany rysunek nie wyka- 
zuje żadnych prawidłowości, nie ma podstaw do kwestionowania niezależności. 


MAPLE 


Zbadamy 200-elementową próbkę, wylosowaną przez program Maple z rozkładu 
jednostajnego na przedziale (0, 1). Histogram narysowany na podstawie tej próbki 
potwierdza raczej charakter rozkładu: 
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Ćwiczenie 8.3 Do uzyskiwania liczb pseudolosowych można używać także innych 
algorytmów. Na przykład, na pierwszy rzut oka wydaje się, że następujący algorytm 
może być lepszy od algorytmu omawianego powyżej: ustalamy ziarno Xo z odcinka 
(0,1), a kolejne liczby otrzymujemy z poprzednich przez podnoszenie do kwadratu, 
wymnażanie przez 10? i branie części ułamkowej: 


Tayi = 10ra — |10*zz |, 


gdzie |y| oznacza część całkowitą liczby y. 
MAPLE 
Wykorzystując program Maple oraz ziarno Xg = 0.123456, generujemy 200 liczb 


pseudolosowych, następnie na ich podstawie rysujemy histogram, a także sprawdza- 
my testem graficznym ich niezależność: 
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Jak widać, do tej pory wszystko wygląda dobrze — wylosujmy jednak 2000 liczb 


i narysujmy dla nich histogram: 


Tak więc, badając dokładniej nasz generator okazało się, że od pewnego miejsca 
wszystkie losowane liczby są równe 0 — po chwili zastanowienia większość studentów 


z pewnością potrafi wyjaśnić, dlaczego tak się stało. 
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Ćwiczenie 8.4 Dość często zdarza się, że w praktycznych zastosowaniach pojawiają 
się tak zwane mieszaniny rozkładów. Na przykład, badając wydzielanie pewnej sub- 
stancji przez bakterie popełnia się błąd polegający na tym, że zamiast od pojedynczej 
bakterii pobiera się tę substancję od dwóch bakterii. Niech e będzie prawdopodobień- 
stwem popełnia tego błędu, zaś fı oraz fo — gęstościami rozkładów substancji wy- 
dzielanych odpowiednio przez pojedynczą bakterię oraz przez dwie złączone bakterie. 
Wtedy rozkład o gęstości: 
(1=e) fi +efo 


odpowiada wielkości pobranej substancji — jest to właśnie mieszanina rozkładów o gę- 
stościach fı i f2. Przeprowadzimy eksperyment polegający na losowaniu próbki z mie- 
szaniny rozkładów normalnych, a następnie dla tak dobranej próbki znajdziemy ją- 
drowy estymator gęstości i porównamy go z gęstością wyjściową. 


Przyjmijmy, że: 
fı € N(5,1), f2 e N(10,1) oraz e = 0.04. 


Losowanie liczb z mieszaniny rozkładów prowadzimy następująco: wylosujemy 
liczbę z rozkładu dwupunktowego (0, 1,e), a następnie jeżeli wypadło 0, to losujemy 
element z rozkładu pierwszego, zaś jeżeli wypadła 1, to losujemy element z rozkładu 
drugiego. 


MAPLE 
Oto lista 200 wylosowanych elementów: 


5.25, 3.91, 5.06, 4.29, 4.54, 5.21, 4.01, 5.77, 6.21, 4.70, 4.04, 5.0, 4.90, 4.38, 5.76, 4.23, 
5.47, 5.13, 4.49, 6.36, 6.65, 4.95, 5.10, 4.69, 5.93, 5.76, 3.98, 6.51, 10.5, 10.4, 4.98, 
3.84, 5.16, 4.53, 5.55, 4.95, 3.58, 5.15, 4.37, 4.50, 4.75, 6.32, 6.33, 3.83, 3.76, 5.07, 
5.39, 5.05, 3.74, 9.54, 3.04, 6.38, 4.82, 3.70, 6.01, 5.82, 8.48, 4.40, 6.61, 5.98, 4.50, 
4.74, 5.56, 4.58, 4.67, 4.26, 7.04, 6.24, 6.38, 6.59, 4.29, 6.28, 6.26, 11.4, 5.46, 9.93, 
5.29, 4.78, 5.69, 5.14, 4.55, 5.18, 5.25, 7.90, 3.44, 5.02, 5.49, 5.43, 4.69, 6.59, 3.81, 
4.76, 5.22, 5.61, 4.28, 5.44, 4.83, 5.51, 3.17, 5.76, 5.0, 4.32, 6.16, 5.27, 4.33, 5.27, 4.42, 
5.36, 4.57, 5.08, 4.47, 2.77, 4.86, 11.1, 5.75, 5.13, 5.26, 5.40, 5.34, 4.30, 3.08, 5.22, 
5.0, 4.20, 4.57, 7.64, 5.36, 5.83, 9.91, 3.82, 5.58, 5.37, 9.39, 4.86, 10.8, 11.4, 5.38, 5.60, 
4.41, 5.74, 5.97, 4.12, 6.12, 5.59, 4.17, 4.39, 5.84, 3.83, 3.42, 6.11, 6.01, 3.40, 5.12, 
6.12, 4.76, 5.30, 5.46, 5.58, 3.39, 5.13, 4.40, 4.31, 6.24, 4.23, 3.93, 10.3, 6.20, 4.29, 
10.8, 7.17, 5.60, 5.96, 9.79, 2.97, 7.16, 4.51, 4.96, 5.82, 5.56, 6.24, 4.67, 4.13, 5.19, 6.47, 
7.42, 5.0, 3.90, 5.61, 5.18, 5.99, 3.68, 4.02, 6.99, 5.33, 7.02, 6.13, 3.94, 5.12, 5.41, 4.32. 


Na podstawie powyższej próby obliczamy: 
1.6222 
V200 


Teraz na wspólnym rysunku zaznaczamy wyjściową gęstość mieszaniny rozkładów 
(kolor niebieski) oraz jądrowy estymator gęstości (kolor czerwony): 


6 = 1.6222, hx = 0.5622. 
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Zadanie 8.1 Opracuj procedurę pozyskiwania liczb pseudolosowych z danego roz- 
kładu dyskretnego, za pomocą liczb pochodzących z rozkładu jednostajnego na prze- 
dziale (0,1). 


Zadanie 8.2 Opracowaną w powyższym zadaniu metodą, wylosuj 100 liczb z roz- 
kładu dwumianowego o parametrach n = 10 i p = 0.2. 


Zadanie 8.3 Wyjaśnij powód, dla którego algorytm opisany w ćwiczeniu 8.3 nie 
może być użyty do losowania liczb pseudolosowych. 


Zadanie 8.4 Na podstawie następującej próbki prostej z nieznanego rozkładu: 
29, 23, 24, 27, 28, 28, 29, 30, 

wyznacz medianę tego rozkładu oraz jej 90% przedział ufności. 

Zadanie 8.5 Przeprowadź dowód tego, że estymator jądrowy jest gęstością. 

Zadanie 8.6 Powtórz ćwiczenie 8.4, używając innych jąder. 

Zadanie 8.7 Wylosuj 100-elementową próbkę z rozkładu wykładniczego o średniej 

Aà = 0.2 i na jej podstawie narysuj jądrowy estymator gęstości. Jaka jest podstawowa 

wada tego estymatora? Zaproponuj taką modyfikację metody estymacji jądrowej 


(zmiana definicji jądra), która pozwoli przezwyciężyć tę trudność. 


Zadanie 8.8 Dla danych z GPW podanych w ćwiczeniu 1.2, naszkicuj jądrowy 
estymator gęstości, a następnie, na tym samym rysunku, umieść wykres rozkładu 
normalnego o parametrach wyestymowanych na podstawie danej próby. 
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